当前位置：首页 > news >正文

RNN：文本生成

news 2026/2/8 7:35:17

文章目录

- 一、完整代码
- 二、过程实现
- - 2.1 导包
  - 2.2 数据准备
  - 2.3 字符分词
  - 2.4 构建数据集
  - 2.5 定义模型
  - 2.6 模型训练
  - 2.7 模型推理
- 三、整体总结

采用RNN和unicode分词进行文本生成

一、完整代码

这里我们使用tensorflow实现，代码如下：

# 完整代码在这里
import tensorflow as tf
import keras_nlp
import numpy as nptokenizer = keras_nlp.tokenizers.UnicodeCodepointTokenizer(vocabulary_size=400)# tokens - ids
ids = tokenizer(['Why are you so funny?', 'how can i get you'])# ids - tokens
tokenizer.detokenize(ids)def split_input_target(sequence):input_text = sequence[:-1]target_text = sequence[1:]return input_text, target_text# 准备数据
text = open('./shakespeare.txt', 'rb').read().decode(encoding='utf-8')
dataset = tf.data.Dataset.from_tensor_slices(tokenizer(text))
dataset = dataset.batch(64, drop_remainder=True)
dataset = dataset.map(split_input_target).batch(64)input, ouput = dataset.take(1).get_single_element()# 定义模型d_model = 512
rnn_units = 1025class CustomModel(tf.keras.Model):def __init__(self, vocabulary_size, d_model, rnn_units):super().__init__(self)self.embedding = tf.keras.layers.Embedding(vocabulary_size, d_model)self.gru = tf.keras.layers.GRU(rnn_units, return_sequences=True, return_state=True)self.dense = tf.keras.layers.Dense(vocabulary_size, activation='softmax')def call(self, inputs, states=None, return_state=False, training=False):x = inputsx = self.embedding(x)if states is None:states = self.gru.get_initial_state(x)x, states = self.gru(x, initial_state=states, training=training)x = self.dense(x, training=training)if return_state:return x, stateselse:return xmodel = CustomModel(tokenizer.vocabulary_size(), d_model, rnn_units)# 查看模型结构
model(input)
model.summary()# 模型配置
model.compile(loss = tf.losses.SparseCategoricalCrossentropy(),optimizer='adam',metrics=['accuracy']
)# 模型训练
model.fit(dataset, epochs=3)# 模型推理
class InferenceModel(tf.keras.Model):def __init__(self, model, tokenizer):super().__init__(self)self.model = modelself.tokenizer = tokenizerdef generate(self, inputs, length, return_states=False):inputs = inputs = tf.constant(inputs)[tf.newaxis]states = Noneinput_ids = self.tokenizer(inputs).to_tensor()outputs = []for i in range(length):predicted_logits, states = model(inputs=input_ids, states=states, return_state=True)input_ids = tf.argmax(predicted_logits, axis=-1)outputs.append(input_ids[0][-1].numpy())outputs = self.tokenizer.detokenize(lst).numpy().decode('utf-8')if return_states:return outputs, stateselse:return outputsinfere = InferenceModel(model, tokenizer)# 开始推理
start_chars = 'hello'
outputs = infere.generate(start_chars, 1000)
print(start_chars + outputs)

二、过程实现

2.1 导包

先导包tensorflow, keras_nlp, numpy

import tensorflow as tf
import keras_nlp
import numpy as np

2.2 数据准备

数据来自莎士比亚的作品 storage.googleapis.com/download.tensorflow.org/data/shakespeare.txt；我们将其下载下来存储为shakespeare.txt

2.3 字符分词

这里我们使用unicode分词：将所有字符都作为一个词来进行分词

tokenizer = keras_nlp.tokenizers.UnicodeCodepointTokenizer(vocabulary_size=400)# tokens - ids
ids = tokenizer(['Why are you so funny?', 'how can i get you'])# ids - tokens
tokenizer.detokenize(ids)

2.4 构建数据集

利用tokenizer和text数据构建数据集

def split_input_target(sequence):input_text = sequence[:-1]target_text = sequence[1:]return input_text, target_texttext = open('./shakespeare.txt', 'rb').read().decode(encoding='utf-8')
dataset = tf.data.Dataset.from_tensor_slices(tokenizer(text))
dataset = dataset.batch(64, drop_remainder=True)
dataset = dataset.map(split_input_target).batch(64)input, ouput = dataset.take(1).get_single_element()

2.5 定义模型

d_model = 512
rnn_units = 1025class CustomModel(tf.keras.Model):def __init__(self, vocabulary_size, d_model, rnn_units):super().__init__(self)self.embedding = tf.keras.layers.Embedding(vocabulary_size, d_model)self.gru = tf.keras.layers.GRU(rnn_units, return_sequences=True, return_state=True)self.dense = tf.keras.layers.Dense(vocabulary_size, activation='softmax')def call(self, inputs, states=None, return_state=False, training=False):x = inputsx = self.embedding(x)if states is None:states = self.gru.get_initial_state(x)x, states = self.gru(x, initial_state=states, training=training)x = self.dense(x, training=training)if return_state:return x, stateselse:return xmodel = CustomModel(tokenizer.vocabulary_size(), d_model, rnn_units)# 查看模型结构
model(input)
model.summary()

2.6 模型训练

model.compile(loss = tf.losses.SparseCategoricalCrossentropy(),optimizer='adam',metrics=['accuracy']
)model.fit(dataset, epochs=3)

2.7 模型推理

定义一个InferenceModel进行模型推理配置；

class InferenceModel(tf.keras.Model):def __init__(self, model, tokenizer):super().__init__(self)self.model = modelself.tokenizer = tokenizerdef generate(self, inputs, length, return_states=False):inputs = inputs = tf.constant(inputs)[tf.newaxis]states = Noneinput_ids = self.tokenizer(inputs).to_tensor()outputs = []for i in range(length):predicted_logits, states = model(inputs=input_ids, states=states, return_state=True)input_ids = tf.argmax(predicted_logits, axis=-1)outputs.append(input_ids[0][-1].numpy())outputs = self.tokenizer.detokenize(lst).numpy().decode('utf-8')if return_states:return outputs, stateselse:return outputsinfere = InferenceModel(model, tokenizer)start_chars = 'hello'
outputs = infere.generate(start_chars, 1000)
print(start_chars + outputs)

生成结果如下所示，感觉很差：

hellonofur us:
medous, teserwomador.
walled o y.
as
t aderemowate tinievearetyedust. manonels,
w?
workeneastily.
watrenerdores aner'shra
palathermalod, te a y, s adousced an
ptit: mamerethus:
bas as t: uaruriryedinesm's lesoureris lares palit al ancoup, maly thitts?
b veatrt
watyeleditenchitr sts, on fotearen, medan ur
tiblainou-lele priniseryo, ofonet manad plenerulyo
thilyr't th
palezedorine.
ti dous slas, sed, ang atad t,
wanti shew.
e
upede wadraredorenksenche:
wedemen stamesly ateara tiafin t t pes:
t: tus mo at
io my.
ane hbrelely berenerusedus' m tr;
p outellilid ng
ait tevadwantstry.
arafincara, es fody
'es pra aluserelyonine
pales corseryea aburures
angab:
sunelyothe: s al, chtaburoly o oonis s tioute tt,
pro.
tedeslenali: s 't ing h
sh, age de, anet: hathes: s es'tht,
as:
wedly at s serinechamai:
mored t.
t monatht t athoumonches le.
chededondirineared
ter
p y
letinalys
ani
aconen,
t rs:
t;et, tes-
luste aly,
thonort aly one telus, s mpsantenam ranthinarrame! a
pul; bon
s fofuly

三、整体总结

RNN结合unicode分词能进行文本生成但是效果一言难尽！

RNN：文本生成

文章目录一、完整代码二、过程实现2.1 导包2.2 数据准备2.3 字符分词2.4 构建数据集2.5 定义模型2.6 模型训练2.7 模型推理三、整体总结采用RNN和unicode分词进行文本生成一、完整代码这里我们使用tensorflow实现，代码如下： # 完整代码在这里 imp…...

编程日记 2023/12/7 18:21:57

Rust UI开发（五）：iced中如何进行页面布局（pick_list的使用）？（串口调试助手）

注：此文适合于对rust有一些了解的朋友 iced是一个跨平台的GUI库，用于为rust语言程序构建UI界面。这是一个系列博文，本文是第五篇，前四篇链接： 1、Rust UI开发（一）：使用iced构建UI时…...

编程日记 2023/12/7 18:18:53

Linux学习笔记2

web服务器部署： 1.装包： [rootlocalhost ~]# yum -y install httpd 2.配置一个首页： [rootlocalhost ~]# echo i love yy > /var/www/html/index.html 启动服务：[rootlocalhost ~]# systemctl start httpd Ctrl W以空格为界…...

编程日记 2023/12/7 18:17:52

数据结构算法-插入排序算法

引言玩纸牌的时候。往往需要将牌从乱序排列变成有序排列这就是插入排序插入排序算法思想先看图首先第一个元素我默认已有序那我们从第二个元素开始，依次插入到前面已有序的部分中。具体来说，我们将第二个元素与第一个元素比较，…...

编程日记 2023/12/7 18:16:51

安装Kuboard管理K8S集群

目录第一章.安装Kuboard管理K8S集群 1.安装kuboard 2.绑定K8S集群，完成信息设定 3.内网安装第二章.kuboard-spray安装K8S 2.1.先拉镜像下来 2.2.之后打开后，先熟悉功能，注意版本 2.3.打开资源包管理，选择符合自己服务器…...

编程日记 2023/12/7 18:15:50

网络安全行业大模型调研总结

随着人工智能技术的发展，安全行业大模型SecLLM（security Large Language Model）应运而生，可应用于代码漏洞挖掘、安全智能问答、多源情报整合、勒索情报挖掘、安全评估、安全事件研判等场景。参考： 1、安全行业大模…...

编程日记 2023/12/7 18:14:49

Linux AMH服务器管理面板本地安装与远程访问

最近，我发现了一个超级强大的人工智能学习网站。它以通俗易懂的方式呈现复杂的概念，而且内容风趣幽默。我觉得它对大家可能会有所帮助，所以我在此分享。点击这里跳转到网站。文章目录 1. Linux 安装AMH 面板2. 本地访问AMH 面板3. Linux安装…...

编程日记 2023/12/7 18:13:48

Sharding-Jdbc（3）：Sharding-Jdbc分表

1 分表分库 LogicTable 数据分片的逻辑表，对于水平拆分的数据库(表)，同一类表的总称。订单信息表拆分为2张表,分别是t_order_0、t_order_1，他们的逻辑表名为t_order。 ActualTable 在分片的数据库中真实存在的物理表。即上个示例中的t_…...

编程日记 2023/12/7 18:11:46

zookeeper集群 +kafka集群

1.zookeeper kafka3.0之前依赖于zookeeper zookeeper是一个开源，分布式的架构，提供协调服务（Apache项目） 基于观察者模式涉及的分布式服务管理架构存储和管理数据，分布式节点上的服务接受观察者的注册&#xff0c…...

编程日记 2023/12/7 18:10:45

2022年全国大学生数据分析大赛医药电商销售数据分析求解全过程论文及程序

2022年全国大学生数据分析大赛医药电商销售数据分析原题再现： 问题背景 20 世纪 90 年代是电子数据交换时代，中国电子商务开始起步并初见雏形，随后 Web 技术爆炸式成长使电子商务处于蓬勃发展阶段，目前互联网信息碎片化以…...

编程日记 2023/12/7 18:08:43

Python版本与opencv版本的对应关系

python版本要和opencv版本相对应，否则安装的时候会报错。可以到Links for opencv-python上面查看python版本和opencv版本的对应关系，如图，红框内是python版本，绿框内是opencv版本。查看自己的python版本后，使用下面…...

编程日记 2023/12/7 18:06:41

【开源视频联动物联网平台】LiteFlow

LiteFlow是一个轻量且强大的国产规则引擎框架，可用于复杂的组件化业务的编排领域。它基于规则文件来编排流程，支持xml、json、yml三种规则文件写法方式，再复杂的逻辑过程都能轻易实现。LiteFlow于2020年正式开源，2021年获得开源中…...

编程日记 2023/12/7 18:05:39

家用智能门锁——智能指纹锁方案

智能指纹锁产品功能： 1：指纹识别技术：光学传感器、半导体传感器或超声波传感器等。 2：指纹容量：智能指纹锁可以存储的指纹数量，通常在几十到几百个指纹之间。 3：解锁时间：指纹识别和…...

编程日记 2023/12/7 18:02:37

Qt6 QRibbon 一键美化Qt界面

强烈推荐一个 github 项目： https://github.com/gnibuoz/QRibbon 作用： 在几乎不修改任何你自己代码的情况下，一键美化你的 UI 界面。代码环境：使用 VS2019 编译 Qt6 GUI 程序，继承 QMainWindow 窗口类一、使用方法 …...

编程日记 2023/12/7 18:01:36

JAVA IO:NIO

1.阻塞 IO 模型最传统的一种 IO 模型，即在读写数据过程中会发生阻塞现象。当用户线程发出 IO 请求之后，内核会去查看数据是否就绪，如果没有就绪就会等待数据就绪，而用户线程就会处于阻塞状态，用户线程交出 CPU。当…...

编程日记 2023/12/7 17:59:34

Python 在控制台打印带颜色的信息

#格式：　　设置颜色开始 ：\033[显示方式;前景色;背景色m #说明： 前景色背景色颜色 --------------------------------------- 30 40 黑色 31 41 红色 32 …...

编程日记 2023/12/7 17:55:31

SQL Server 数据库，创建触发器避免数据被更改

5.4触发器触发器是一种特殊类型的存储过程，当表中的数据发生更新时将自动调用，以响应INSERT、 UPDATE 或DELETE 语句。 5.4.1什么是触发器 1.触发器的概念触发器是在对表进行插入、更新或删除操作时自动执行的存储过程，触发器通常用于强…...

编程日记 2023/12/7 17:54:30

C语言实现植物大战僵尸(完整版）

实现这个游戏需要Easy_X 这个在我前面一篇C之番外篇爱心代码有程序教你怎么下载，大家可自行查看然后就是需要植物大战僵尸的素材和音乐，需要的可以在评论区首先是main.cpp //开发日志 //1导入素材 //2实现最开始的游戏场景 //3实现游戏顶部的工具栏…...

编程日记 2023/12/7 17:52:28

基于YOLOv8深度学习的火焰烟雾检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ 👍感谢小伙伴们点赞、关注！ 《------往期经典推…...

编程日记 2023/12/7 17:51:27

【C++】手撕string思路梳理

目录基本思路代码实现 1.构建框架： 2.构建函数重载 3.迭代器： 4.遍历string 5.resetve 开空间，insert任意位置插入push_back,append,(按顺序依次实现) 6.erase删除，clear清除，resize缩容 7.流插入&#xff0…...

编程日记 2023/12/7 17:49:26

应用升级/灾备测试时使用guarantee 闪回点迅速回退

1.场景应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。相对于RMAN恢复需要很长时间， 数据库闪回只需要几分钟。 2.技术实现数据库设置 2个db_recovery参数创建guarantee闪回点，不需要开启数据库闪回。…...

编程新知 2026/1/14 22:12:47

pam_env.so模块配置解析

在PAM（Pluggable Authentication Modules）配置中， /etc/pam.d/su 文件相关配置含义如下： 配置解析 auth required pam_env.so1. 字段分解字段值说明模块类型auth认证类模块，负责验证用户身份&am…...

编程新知 2025/10/5 8:09:39

CREATE USER read_only WITH PASSWORD 密码 -- 连接到xxx数据库 \c xxx -- 授予对xxx数据库的只读权限 GRANT CONNECT ON DATABASE xxx TO read_only; GRANT USAGE ON SCHEMA public TO read_only; GRANT SELECT ON ALL TABLES IN SCHEMA public TO read_only; GRANT EXECUTE O…...

编程新知 2025/9/18 19:34:22

Mac下Android Studio扫描根目录卡死问题记录

环境信息操作系统: macOS 15.5 (Apple M2芯片)Android Studio版本: Meerkat Feature Drop | 2024.3.2 Patch 1 (Build #AI-243.26053.27.2432.13536105, 2025年5月22日构建) 问题现象在项目开发过程中，提示一个依赖外部头文件的cpp源文件需要同步，点…...

编程新知 2026/2/6 1:00:00

docker 部署发现spring.profiles.active 问题

报错： org.springframework.boot.context.config.InvalidConfigDataPropertyException: Property spring.profiles.active imported from location class path resource [application-test.yml] is invalid in a profile specific resource [origin: class path re…...

编程新知 2025/9/20 12:14:18