当前位置：首页 > news >正文

BiLSTM模型实现

news 2026/2/7 20:26:45

# 本段代码构建类BiLSTM, 完成初始化和网络结构的搭建
# 总共3层: 词嵌入层, 双向LSTM层, 全连接线性层

# 本段代码构建类BiLSTM, 完成初始化和网络结构的搭建
# 总共3层: 词嵌入层, 双向LSTM层, 全连接线性层
import torch
import torch.nn as nn# 本函数实现将中文文本映射为数字化张量
def sentence_map(sentence_list, char_to_id, max_length):"""将句子中的每一个字符映射到码表中:param sentence_list: 待映射的句子，类型为字符串或列表:param char_to_id: 码表，类型为字典，格式为格式为{"字1": 1, "字2": 2}，例如：码表与id对照：char_to_id = {"双": 0, "肺": 1, "见": 2, "多": 3, "发": 4, "斑": 5, "片": 6,"状": 7, "稍": 8, "高": 9, "密": 10, "度": 11, "影": 12, "。": 13}:param max_length::return: 每一个字对应的编码，类型为tensor"""# 字符串按照逆序进行排序，不是必须操作sentence_list.sort(key=lambda c:len(c), reverse = True)# 定义句子映射列表sentence_map_list = []for sentence in sentence_list:# 生成句子中每个字对应的id列表sentence_id_list =[char_to_id[c] for c in sentence]# 计算所要填充0的长度padding = [0] * (max_length-len(sentence))# 组合sentence_map_list.append(sentence_id_list)# 返回句子映射集合，转为标量return torch.tensor(sentence_map_list, dtype= torch.long)class BiLSTM(nn.Module):"""BiLSTM模型定义"""def __init__(self, vocab_size, tag_to_id, input_feature_size, hidden_size,batch_size, sentence_length, num_layers=1, batch_first=True):"""description: 模型初始化:param vocab_size:          所有句子包含字符大小:param tag_to_id:           标签与 id 对照:param input_feature_size:  字嵌入维度( 即LSTM输入层维度 input_size ):param hidden_size:         隐藏层向量维度:param batch_size:          批训练大小:param sentence_length      句子长度:param num_layers:          堆叠 LSTM 层数:param batch_first:         是否将batch_size放置到矩阵的第一维度"""# 类继承初始化函数super(BiLSTM, self).__init__()# 设置标签与id对照self.tag_to_id = tag_to_id# 设置标签大小, 对应BiLSTM最终输出分数矩阵宽度self.tag_size = len(tag_to_id)# 设定LSTM输入特征大小, 对应词嵌入的维度大小self.embedding_size = input_feature_size# 设置隐藏层维度, 若为双向时想要得到同样大小的向量, 需要除以2self.hidden_size = hidden_size // 2# 设置批次大小, 对应每个批次的样本条数, 可以理解为输入张量的第一个维度self.batch_size = batch_size# 设定句子长度self.sentence_length = sentence_length# 设定是否将batch_size放置到矩阵的第一维度, 取值True, 或Falseself.batch_first = batch_first# 设置网络的LSTM层数self.num_layers = num_layers"""构建词嵌入层: 字向量, 维度为总单词数量与词嵌入维度参数: 总体字库的单词数量, 每个字被嵌入的维度"""self.embedding = nn.Embedding(vocab_size, self.embedding_size)self.bilstm = nn.LSTM(input_size=input_feature_size,hidden_size=self.hidden_size,num_layers=num_layers,bidirectional=True,batch_first=batch_first)# 构建全连接线性层: 将BiLSTM的输出层进行线性变换self.linear = nn.Linear(hidden_size, self.tag_size)print("=" * 100)
# 参数1:码表与id对照
char_to_id = {"双": 0, "肺": 1, "见": 2, "多": 3, "发": 4, "斑": 5, "片": 6,"状": 7, "稍": 8, "高": 9, "密": 10, "度": 11, "影": 12, "。": 13}# 参数2:标签码表对照
tag_to_id = {"O": 0, "B-dis": 1, "I-dis": 2, "B-sym": 3, "I-sym": 4}
# 参数3:字向量维度
EMBEDDING_DIM = 200
# 参数4:隐层维度
HIDDEN_DIM = 100
# 参数5:批次大小
BATCH_SIZE = 8
# 参数6:句子长度
SENTENCE_LENGTH = 20
# 参数7:堆叠 LSTM 层数
NUM_LAYERS = 1# 初始化模型
"""
model = BiLSTM(vocab_size=len(char_to_id),tag_to_id=tag_to_id,input_feature_size=EMBEDDING_DIM,hidden_size=HIDDEN_DIM,batch_size= BATCH_SIZE,sentence_length= SENTENCE_LENGTH,num_layers=NUM_LAYERS)print(model)
"""

BiLSTM模型实现

# 本段代码构建类BiLSTM, 完成初始化和网络结构的搭建 # 总共3层: 词嵌入层, 双向LSTM层, 全连接线性层 # 本段代码构建类BiLSTM, 完成初始化和网络结构的搭建 # 总共3层: 词嵌入层, 双向LSTM层, 全连接线性层 import torch import torch.nn as nn# 本函数实现将中文文本映射为…...

编程日记 2024/7/7 10:25:58

linux内核源码学习所需基础

1.面向对象的思想，尤其是oopc的实现方式。 2.设计模式。这两点需要内核源码学习者不仅要会c和汇编，还要接触一门面向对象的语言，比如c＋＋/java/python等等任意一门都行，起码要了解面向对象的思想。另外li…...

编程日记 2024/7/7 10:24:56

Java并发编程-AQS详解及案例实战（上篇）

文章目录 AQS概述AQS 的核心概念AQS 的工作原理AQS 的灵活性使用场景使用指南使用示例AQS的本质:为啥叫做异步队列同步器AQS的核心机制“异步队列”的含义“同步器”的含义总结加锁失败的时候如何借助AQS异步入队阻塞等待AQS的锁队列加锁失败时的处理流程异步入队的机制总结Ree…...

编程日记 2024/7/7 10:19:50

第11章规划过程组（二）（11.8排列活动顺序）

第11章规划过程组（二）11.8排列活动顺序，在第三版教材第391页； 文字图片音频方式第一个知识点：主要输出 1、项目进度网络图如图11-20 项目进度网络图示例带有多个紧前活动的活动代表路径汇聚，而带有…...

编程日记 2024/7/7 10:18:49

DP学习——观察者模式

学而时习之，温故而知新。敌人出招（使用场景） 多个对象依赖一个对象的状态改变，当业务中有这样的关系时你出什么招？ 你出招这个时候就要用观察者模式这招了！ 2个角色分为啥主题和观察者角色。我觉…...

编程日记 2024/7/7 10:17:47

如何利用GPT-4o生成有趣的梗图

文章目录如何利用GPT-4o生成有趣的梗图一、引言二、使用GPT-4o生成梗图1. 提供主题2. 调用工具3. 获取图片实际案例输入输出三、更多功能1. 创意和灵感2. 梗图知识四、总结如何利用GPT-4o生成有趣的梗图梗图，作为互联网文化的一部分，已经成为了我们…...

编程日记 2024/7/7 10:15:45

深入理解 KVO

在 iOS 中，KVO（Key-Value Observing）是一个强大的观察机制，它的底层实现相对复杂。KVO 利用 Objective-C 的动态特性，为对象的属性提供观察能力。 KVO 的底层实现 1. 动态子类化当一个对象的属性被添加观察者时&am…...

编程日记 2024/7/7 10:14:43

当需要对大量数据进行排序操作时，怎样优化内存使用和性能？

文章目录一、选择合适的排序算法1. 快速排序2. 归并排序3. 堆排序二、数据结构优化1. 使用索引2. 压缩数据3. 分块排序三、外部排序1. 多路归并排序四、利用多核和并行计算1. 多线程排序2. 使用并行流五、性能调优技巧1. 避免不必要的内存复制2. 缓存友好性3. 基准测试和性…...

编程日记 2024/7/7 10:12:41

kubernetes集群部署：node节点部署和cri-docker运行时安装（四）

安装前准备同《kubernetes集群部署：环境准备及master节点部署（二）》安装cri-docker 在 Kubernetes 1.20 版本之前，Docker 是 Kubernetes 默认的容器运行时。然而，Kubernetes 社区决定在 Kubernetes 1.20 及以后的…...

编程日记 2024/7/7 10:11:39

第五十章 Web Service URL 汇总

文章目录第五十章 Web Service URL 汇总Web 服务 URLWeb 服务的端点WSDL 使用受密码保护的 WSDL URL 第五十章 Web Service URL 汇总本主题总结了与 IRIS 数据平台 Web 服务相关的 URL。 Web 服务 URL 与 IRIS Web 服务相关的 URL 如下： Web 服务的端点 http…...

编程日记 2024/7/7 10:10:37

动态白色小幽灵404网站源码

动态白色小幽灵404网站源码，页面时单页HTML源码，将代码放到空白的html里面，鼠标双击html即可查看效果，或者上传到服务器，错误页重定向这个界面即可，喜欢的朋友可以拿去使用 <!DOCTYPE html> <ht…...

编程日记 2024/7/7 10:09:36

axios的使用，处理请求和响应，axios拦截器

1、axios官网 https://www.axios-http.cn/docs/interceptors 2、安装 npm install axios 3、在onMouunted钩子函数中使用axios来发送请求，接受响应 4.出现的问题： （1） 但是如果发送请求请求时间过长，回出现请求待处…...

编程日记 2024/7/7 10:08:34

visual studio 2017增加.cu文件

右击项目名称，选择生成依赖项>生成自定义把CUDA11.3target勾选上； 把带有cuda代码的.cpp文件和.cu文件右击属性>项类型>选择CUDA C/C 右击项目名称，C/C>命令行添加/D _CRT_SECURE_NO_WARNINGS； 选择CUDA C/C>命…...

编程日记 2024/7/7 10:05:31

linux 管道符 |

在Linux中，管道符（|）是一个非常重要的概念，它允许你将一个命令的输出作为另一个命令的输入。这种机制使得Linux命令可以非常灵活地进行组合，从而执行复杂的任务。管道符的基本用法假设你有两个命令：com…...

编程日记 2024/7/7 10:04:29

Android - SIP 协议

SIP 代表(会话发起协议)。它是一种协议，可让应用程序轻松设置呼出和呼入语音呼叫，而无需直接管理会话、传输级通信或音频记录或回放。 SIP 应用程序 SIP 的一些常见应用是。视频会议即时消息开发要求以下是开发 SIP 应用程序的要求 − Android 操作系…...

编程日记 2024/7/7 10:00:22

Python结合MobileNetV2：图像识别分类系统实战

一、目录算法模型介绍模型使用训练模型评估项目扩展二、算法模型介绍图像识别是计算机视觉领域的重要研究方向，它在人脸识别、物体检测、图像分类等领域有着广泛的应用。随着移动设备的普及和计算资源的限制，设计高效的图像识别算法变得尤为重要。…...

编程日记 2024/7/7 9:59:21

【】AI八股-神经网络相关

Deep-Learning-Interview-Book/docs/深度学习.md at master amusi/Deep-Learning-Interview-Book GitHub 网上相关总结： 小菜鸡写一写基础深度学习的问题（复制大佬的，自己复习用） - 知乎 (zhihu.com) CV面试问题准备持续更新贴 …...

编程日记 2024/7/7 9:58:20

NodeJs的安装与环境变量配置

Node.js的环境变量配置主要涉及设置Node.js的安装路径、npm（Node Package Manager）的全局模块安装路径和缓存路径，以及可能需要的国内镜像源配置。以下是详细的配置步骤： 一、安装Node.js 下载Node.js安装包： 访问Nod…...

编程日记 2024/7/7 9:57:19

进程输入输出及终端属性学习

进程的标准输入输出当主进程fork或exec子进程，文件描述符被继承，因此0,1,2句柄也被继承，从而使得telnet等服务，可以做到间接调用别的shell或程序。比如如果是远程登录使用的zsh，那么其会重定向到相应的pts $ ps|gre…...

编程日记 2024/7/7 9:56:17

关于redis集群和事务

最近为了核算项目的两个架构指标（可用性和伸缩性），需要对项目中使用的Redis数据库的集群部署进行一定程度的了解，当然顺便再学习一遍它的事务细节。既然我在上面把Redis称之为数据库，那么在我们目前的项目里&#xf…...

编程日记 2024/7/7 9:54:15

利用ngx_stream_return_module构建简易 TCP/UDP 响应网关

一、模块概述 ngx_stream_return_module 提供了一个极简的指令： return <value>;在收到客户端连接后，立即将 <value> 写回并关闭连接。<value> 支持内嵌文本和内置变量（如 $time_iso8601、$remote_addr 等）&a…...

编程新知 2025/9/21 0:49:02

中南大学无人机智能体的全面评估！BEDI：用于评估无人机上具身智能体的综合性基准测试

作者：Mingning Guo, Mengwei Wu, Jiarun He, Shaoxian Li, Haifeng Li, Chao Tao单位：中南大学地球科学与信息物理学院论文标题：BEDI: A Comprehensive Benchmark for Evaluating Embodied Agents on UAVs论文链接：https://arxiv.…...

编程新知 2026/1/22 15:36:10

【机器视觉】单目测距——运动结构恢复

ps：图是随便找的，为了凑个封面前言在前面对光流法进行进一步改进，希望将2D光流推广至3D场景流时，发现2D转3D过程中存在尺度歧义问题，需要补全摄像头拍摄图像中缺失的深度信息，否则解空间不收敛&#xf…...

编程新知 2026/1/24 20:17:55

AspectJ 在 Android 中的完整使用指南

一、环境配置（Gradle 7.0 适配） 1. 项目级 build.gradle // 注意：沪江插件已停更，推荐官方兼容方案 buildscript {dependencies {classpath org.aspectj:aspectjtools:1.9.9.1 // AspectJ 工具} } 2. 模块级 build.gradle plu…...

编程新知 2025/7/7 22:33:57

管理学院权限管理系统开发总结

文章目录 🎓 管理学院权限管理系统开发总结 - 现代化Web应用实践之路📝 项目概述🏗️ 技术架构设计后端技术栈前端技术栈 💡 核心功能特性1. 用户管理模块2. 权限管理系统3. 统计报表功能4. 用户体验优化 🗄️ 数据库设…...

编程新知 2026/1/24 6:30:25

基于IDIG-GAN的小样本电机轴承故障诊断

目录 🔍 核心问题一、IDIG-GAN模型原理 1. 整体架构 2. 核心创新点 (1) 梯度归一化（Gradient Normalization） (2) 判别器梯度间隙正则化（Discriminator Gradient Gap Regularization） (3) 自注意力机制（Self-Attention） 3. 完整损失函数二…...

编程新知 2026/1/31 10:58:46

腾讯云V3签名

想要接入腾讯云的Api，必然先按其文档计算出所要求的签名。之前也调用过腾讯云的接口，但总是卡在签名这一步，最后放弃选择SDK，这次终于自己代码实现。可能腾讯云翻新了接口文档，现在阅读起来，清晰了很多&…...

编程新知 2026/1/24 4:39:04

Kubernetes 网络模型深度解析：Pod IP 与 Service 的负载均衡机制，Service到底是什么？

Pod IP 的本质与特性 Pod IP 的定位纯端点地址：Pod IP 是分配给 Pod 网络命名空间的真实 IP 地址（如 10.244.1.2）无特殊名称：在 Kubernetes 中，它通常被称为 “Pod IP” 或 “容器 IP”生命周期：与 Pod …...

编程新知 2025/11/4 22:48:45

人工智能 - 在Dify、Coze、n8n、FastGPT和RAGFlow之间做出技术选型

在Dify、Coze、n8n、FastGPT和RAGFlow之间做出技术选型。这些平台各有侧重，适用场景差异显著。下面我将从核心功能定位、典型应用场景、真实体验痛点、选型决策关键点进行拆解，并提供具体场景下的推荐方案。一、核心功能定位速览平台核心定位技术栈亮…...

编程新知 2025/8/8 13:20:37

CppCon 2015 学习:Time Programming Fundamentals

Civil Time 公历时间特点： 共 6 个字段： Year（年）Month（月）Day（日）Hour（小时）Minute（分钟）Second（秒） 表示…...

编程新知 2025/11/29 18:42:46

相关文章：