当前位置：首页 > news >正文

PyTorch -- RNN 快速实践

news 2026/2/8 13:48:42

RNN Layer torch.nn.RNN(input_size,hidden_size,num_layers,batch_first)
- input_size: 输入的编码维度
- hidden_size: 隐含层的维数
- num_layers: 隐含层的层数
- batch_first: ·True 指定输入的参数顺序为：
  - x：[batch, seq_len, input_size]
  - h0：[batch, num_layers, hidden_size]
RNN 的输入：
- x：[seq_len, batch, input_size]
  - seq_len: 输入的序列长度
  - batch: batch size 批大小
- h0：[num_layers, batch, hidden_size]
RNN 的输出：
- y: [seq_len, batch, hidden_size]

在这里插入图片描述

实战之预测 正弦曲线：以下会以此为例，演示 RNN 预测任务的部署
在这里插入图片描述

步骤一：确定 RNN Layer 相关参数值并基于此创建 Net

import numpy as np
from matplotlib import pyplot as pltimport torch
import torch.nn as nn
import torch.optim as optimseq_len     = 50
batch       = 1
num_time_steps = seq_leninput_size  = 1
output_size = input_size
hidden_size = 10  	
num_layers = 1  	
batch_first = True class Net(nn.Module):  ## model 定义def __init__(self):super(Net, self).__init__()self.rnn = nn.RNN(input_size=input_size,hidden_size=hidden_size,num_layers=num_layers,batch_first=batch_first)# for p in self.rnn.parameters():# 	nn.init.normal_(p, mean=0.0, std=0.001)self.linear = nn.Linear(hidden_size, output_size)def forward(self, x, hidden_prev):out, hidden_prev = self.rnn(x, hidden_prev)# out: [batch, seq_len, hidden_size]out = out.view(-1, hidden_size)  # [batch*seq_len, hidden_size]out = self.linear(out) 			 # [batch*seq_len, output_size]out = out.unsqueeze(dim=0)    # [1, batch*seq_len, output_size]return out, hidden_prev

步骤二：确定训练流程

lr=0.01def tarin_RNN():model = Net()print('model:\n',model)criterion = nn.MSELoss()optimizer = optim.Adam(model.parameters(), lr)hidden_prev = torch.zeros(num_layers, batch, hidden_size)  #初始化hl = []for iter in range(100):  # 训练100次start = np.random.randint(10, size=1)[0]  ## 序列起点time_steps = np.linspace(start, start+10, num_time_steps)  ## 序列data = np.sin(time_steps).reshape(num_time_steps, 1)  ## 序列数据x = torch.tensor(data[:-1]).float().view(batch, seq_len-1, input_size)y = torch.tensor(data[1: ]).float().view(batch, seq_len-1, input_size)  # 目标为预测一个新的点output, hidden_prev = model(x, hidden_prev)hidden_prev = hidden_prev.detach()  ## 最后一层隐藏层的状态要 detachloss = criterion(output, y)model.zero_grad()loss.backward()optimizer.step()if iter % 100 == 0:print("Iteration: {} loss {}".format(iter, loss.item()))l.append(loss.item())#############################绘制损失函数#################################plt.plot(l,'r')plt.xlabel('训练次数')plt.ylabel('loss')plt.title('RNN LOSS')plt.savefig('RNN_LOSS.png')return hidden_prev,modelhidden_prev,model = tarin_RNN()

步骤三：测试训练结果

start = np.random.randint(3, size=1)[0]  ## 序列起点
time_steps = np.linspace(start, start+10, num_time_steps)  ## 序列
data = np.sin(time_steps).reshape(num_time_steps, 1)  ## 序列数据
x = torch.tensor(data[:-1]).float().view(batch, seq_len-1, input_size)
y = torch.tensor(data[1: ]).float().view(batch, seq_len-1, input_size)  # 目标为预测一个新的点    predictions = []  ## 预测结果
input = x[:,0,:]
for _ in range(x.shape[1]):input = input.view(1, 1, 1)pred, hidden_prev = model(input, hidden_prev)input = pred  ## 循环获得每个input点输入网络predictions.append(pred.detach().numpy()[0])
x= x.data.numpy()
y = y.data.numpy( )
plt.scatter(time_steps[:-1], x.squeeze(), s=90)
plt.plot(time_steps[:-1], x.squeeze())
plt.scatter(time_steps[1:],predictions)  ## 黄色为预测
plt.show()

在这里插入图片描述

【高阶】上述例子比较简单，便于入门以推理到自己的目标任务，实际 RNN (长时间序列) 训练可能更有难度，可以添加

对于梯度爆炸的解决：

for p in model.parameters()"print(p.grad.norm())  ## 查阅梯度，看看是否爆炸torch.nn.utils.clip_grad_norm_(p, 10)  ## grad 限幅，其中的 norm 后面的_ 表示 in place 操作

对于梯度消失的解决：-> LSTM

另一个很好的实例关于飞行轨迹预测- - RNN-博客链接，可供学习参考
B站视频参考资料

PyTorch -- RNN 快速实践

RNN Layer torch.nn.RNN(input_size,hidden_size,num_layers,batch_first) input_size: 输入的编码维度hidden_size: 隐含层的维数num_layers: 隐含层的层数batch_first: True 指定输入的参数顺序为： x：[batch, seq_len, input_size]h0：[batc…...

编程日记 2024/6/23 2:30:26

SpringBoot 快速入门（保姆级详细教程）

目录一、Springboot简介二、SpringBoot 优点： 三、快速入门 1、新建工程方式2：使用Spring Initializr创建项目写在前面： SpringBoot 是 Spring家族中的一个全新框架，用来简化spring程序的创建和开发过程。SpringBoot化繁…...

编程日记 2024/6/23 2:29:24

【第18章】Vue实战篇之登录界面

文章目录前言一、数据绑定1. 数据绑定2. 数据清空二、表单校验1. 代码2. 展示三、登录1.登录按钮2.user.js3. login 四、展示总结前言上一章完成用户注册，这一章主要做用户登录。一、数据绑定登录和注册使用相同的数据绑定 1. 数据绑定 <!-- 登录表单 -…...

编程日记 2024/6/23 2:26:22

[C++]使用C++部署yolov10目标检测的tensorrt模型支持图片视频推理windows测试通过

【测试通过环境】 vs2019 cmake3.24.3 cuda11.7.1cudnn8.8.0 tensorrt8.6.1.6 opencv4.8.0 【部署步骤】获取pt模型：https://github.com/THU-MIG/yolov10训练自己的模型或者直接使用yolov10官方预训练模型下载源码：https://github.com/laugh12321/yol…...

编程日记 2024/6/23 2:25:20

分享uniapp + Springboot3+vue3小程序项目实战

分享uniapp Springboot3vue3小程序项目实战经过10天敲代码，终于从零到项目测试完成，一个前后端分离的小程序实战项目学习完毕时间从6月12日到6月22日，具有程序开发基础，第一次写uniapp,Springboot以前用过，VUE3也…...

编程日记 2024/6/23 2:24:19

Ubuntu 24.04安装zabbix7.0.0图形中文乱码

当zabbix安装完成后，设置中文界面时，打开图形，中文内容会显示方框乱码，是因为服务器字体中没有相关的中文字体，需要更换。 1、找到中文字体，可以在网络上下载《得意黑》开源字体，也可以在windo…...

编程日记 2024/6/23 2:23:17

方式一 DemoMapper.java Mapper public interface DemoMapper extends BaseMapper<TableConfig> {Update("${sql}")int createTable(Param("sql") String sql); }测试代码 SpringBootTest class DemoMapperTest {Resourceprivate DemoMapper demo…...

编程日记 2024/6/23 2:22:16

1.SG90

目录一.实物图二.原理图三.简介四.工作原理一.实物图二.原理图三.简介舵机（英文叫Servo），是伺服电机的一种，伺服电机就是带有反馈环节的电机，这种电机可以进行精确的位置控制或者输出较高的扭矩。舵机…...

编程日记 2024/6/23 2:21:15

【yolov8语义分割】跑通：下载yolov8+预测图片+预测视频

1、下载yolov8到autodl上 git clone https://github.com/ultralytics/ultralytics 下载到Yolov8文件夹下面另外：现在yolov8支持像包一样导入，pip install就可以 2、yolov8 语义分割文档看官方文档：主页 -Ultralytics YOLO 文档还能切…...

编程日记 2024/6/23 2:20:13

基于STM8系列单片机驱动74HC595驱动两个3位一体的数码管

1）单片机/ARM硬件设计小知识，分享给将要学习或者正在学习单片机/ARM开发的同学。 2）内容属于原创，若转载，请说明出处。 3）提供相关问题有偿答疑和支持。为了节省单片机MCU的IO口资源驱动6个数码管&…...

编程日记 2024/6/23 2:19:11

Jlink下载固件到RAM区

Jlink下载固件到RAM区准备批处理搜索exe批处理读取bin数据解析调用jlink批处理准备jlink脚本调用执行环境：J-Flash V7.96g 平台：arm cortex-m3 准备批处理搜索exe批处理 find_file.bat echo off:: 自动识别脚本名和路径 set "SCRIPT_DIR%~dp…...

编程日记 2024/6/23 2:16:08

Kotlin基础——Typeclass

高阶类型如在Iterable新增泛型方法时 interface Iterable<T> {fun filter(p: (T) -> Boolean): Iterable<T>fun remove(p: (T) -> Boolean): Iterable<T> filter { x -> !p(x) } }对应的List、Set实现上述方法时仍需要返回具体的类型 interfac…...

编程日记 2024/6/23 2:14:06

DC-DC 高压降压、非隔离AC-DC、提供强大的动力，选择优质电源芯片-（昱灿）

畅享长续航，尽在我们的充电芯片！ 无论是手机、平板还是智能设备，长时间使用后电量不足总是令人头疼。然而，我们的充电芯片将为您带来全新的充电体验！采用先进的技术，我们的充电芯片能够提供快速而稳定的充电…...

编程日记 2024/6/23 2:12:04

GPT-4o的视觉识别能力，将绕过所有登陆的图形验证码

知识星球🔗除了包含技术干货：《Java代码审计》《Web安全》《应急响应》《护网资料库》《网安面试指南》还包含了安全中常见的售前护网案例、售前方案、ppt等，同时也有面向学生的网络安全面试、护网面试等。我们来看一下市面上常见的图形验证…...

编程日记 2024/6/23 2:10:02

【LinuxC语言】进程间的通信——管道

文章目录前言不同进程间通信的方式管道匿名管道和命名管道半双工与全双工管道相关函数创建管道总结前言在Linux操作系统中，进程是执行中的程序的实例。每个进程都有自己的地址空间，数据栈以及其他用于跟踪进程执行的辅助数据。操作系统管理这些进程，并通过调度算法来分享…...

编程日记 2024/6/23 2:08:00

CompletableFuture 基本用法

一、 CompletableFuture简介 CompletableFuture 是 Java 8 引入的一个功能强大的类，用于异步编程和并发处理。它提供了丰富的 API 来处理异步任务的结果，支持函数式编程风格，并允许通过链式调用组合多个异步操作。二、CompletableFuture中…...

编程日记 2024/6/23 2:06:58

网页如何发布到服务器上

将网页发布到服务器上的过程涉及多个步骤，包括准备阶段、选择托管提供商、发布网站等。12 准备阶段： 确保在本地开发环境中对网站进行了充分的测试，包括功能测试、性能测试和安全测试。检查Web.config文件，确保所有的配置设置…...

编程日记 2024/6/23 2:04:56

Jenkins简要说明

Jenkins 是一个开源的持续集成和持续部署（CI/CD）工具，广泛用于自动化软件开发过程中的构建、测试和部署等任务。它是基于Java开发的，因此可以在任何支持Java的平台上运行，并且能够与各种操作系统、开发工具和插件无缝集…...

编程日记 2024/6/23 2:02:54

C# 比较基础知识：最佳实践和技巧

以下是一些在 C# 中进行比较的技巧和窍门的概述。 1. 比较原始类型对于原始类型（int、double、char 等），可以使用标准比较运算符。 int a 5; int b 10; bool isEqual (a b); // false bool isGreater (a > b); // false bool is…...

编程日记 2024/6/23 2:01:52

Ansible 自动化运维实践

随着 IT 基础设施的复杂性不断增加，手动运维已无法满足现代企业对高效、可靠的 IT 运维需求。Ansible 作为一款开源的自动化运维工具，通过简洁易用的 YAML 语法和无代理（agentless）架构，极大简化了系统配置管理、应用部…...

编程日记 2024/6/23 2:00:50

MongoDB学习和应用(高效的非关系型数据库)

一丶 MongoDB简介对于社交类软件的功能，我们需要对它的功能特点进行分析： 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具： mysql：关系型数据库&am…...

编程新知 2026/1/23 10:24:30

遍历 Map 类型集合的方法汇总

1 方法一先用方法 keySet() 获取集合中的所有键。再通过 gey(key) 方法用对应键获取值 import java.util.HashMap; import java.util.Set;public class Test {public static void main(String[] args) {HashMap hashMap new HashMap();hashMap.put("语文",99);has…...

编程新知 2026/1/24 15:08:45

FastAPI 教程：从入门到实践

FastAPI 是一个现代、快速（高性能）的 Web 框架，用于构建 API，支持 Python 3.6。它基于标准 Python 类型提示，易于学习且功能强大。以下是一个完整的 FastAPI 入门教程，涵盖从环境搭建到创建并运行一个简单的…...

编程新知 2025/10/16 7:51:26

c++ 面试题(1)-----深度优先搜索（DFS）实现

操作系统：ubuntu22.04 IDE:Visual Studio Code 编程语言：C11 题目描述地上有一个 m 行 n 列的方格，从坐标 [0,0] 起始。一个机器人可以从某一格移动到上下左右四个格子，但不能进入行坐标和列坐标的数位之和大于 k 的格子。例…...

编程新知 2026/1/10 10:16:16

CocosCreator 之 JavaScript/TypeScript和Java的相互交互

引擎版本： 3.8.1 语言： JavaScript/TypeScript、C、Java 环境：Window 参考：Java原生反射机制您好，我是鹤九日！ 回顾在上篇文章中：CocosCreator Android项目接入UnityAds 广告SDK。我们简单讲…...

编程新知 2026/1/30 12:10:19

高防服务器能够抵御哪些网络攻击呢？

高防服务器作为一种有着高度防御能力的服务器，可以帮助网站应对分布式拒绝服务攻击，有效识别和清理一些恶意的网络流量，为用户提供安全且稳定的网络环境，那么，高防服务器一般都可以抵御哪些网络攻击呢？下面…...

编程新知 2025/9/3 19:14:38

OpenLayers 分屏对比(地图联动)

注：当前使用的是 ol 5.3.0 版本，天地图使用的key请到天地图官网申请，并替换为自己的key 地图分屏对比在WebGIS开发中是很常见的功能，和卷帘图层不一样的是，分屏对比是在各个地图中添加相同或者不同的图层进行对比查看。…...

编程新知 2025/12/25 18:22:43

AspectJ 在 Android 中的完整使用指南

一、环境配置（Gradle 7.0 适配） 1. 项目级 build.gradle // 注意：沪江插件已停更，推荐官方兼容方案 buildscript {dependencies {classpath org.aspectj:aspectjtools:1.9.9.1 // AspectJ 工具} } 2. 模块级 build.gradle plu…...

编程新知 2025/7/7 22:33:57

STM32---外部32.768K晶振（LSE）无法起振问题

晶振是否起振主要就检查两个1、晶振与MCU是否兼容；2、晶振的负载电容是否匹配目录一、判断晶振与MCU是否兼容二、判断负载电容是否匹配 1. 晶振负载电容（CL）与匹配电容（CL1、CL2）的关系 2. 如何选择 CL1 和 CL…...

编程新知 2026/2/7 10:55:43

Web后端基础(基础知识)

BS架构：Browser/Server，浏览器/服务器架构模式。客户端只需要浏览器，应用程序的逻辑和数据都存储在服务端。优点：维护方便缺点：体验一般 CS架构：Client/Server，客户端/服务器架构模式。需要单独…...

编程新知 2026/2/2 0:52:30

PyTorch -- RNN 快速实践

相关文章：

PyTorch -- RNN 快速实践

SpringBoot 快速入门（保姆级详细教程）

【第18章】Vue实战篇之登录界面

[C++]使用C++部署yolov10目标检测的tensorrt模型支持图片视频推理windows测试通过

分享uniapp + Springboot3+vue3小程序项目实战

Ubuntu 24.04安装zabbix7.0.0图形中文乱码

MybatisPlus 调用原生SQL

1.SG90

【yolov8语义分割】跑通：下载yolov8+预测图片+预测视频

基于STM8系列单片机驱动74HC595驱动两个3位一体的数码管

Jlink下载固件到RAM区

Kotlin基础——Typeclass

DC-DC 高压降压、非隔离AC-DC、提供强大的动力，选择优质电源芯片-（昱灿）

GPT-4o的视觉识别能力，将绕过所有登陆的图形验证码

【LinuxC语言】进程间的通信——管道

CompletableFuture 基本用法

网页如何发布到服务器上

Jenkins简要说明

C# 比较基础知识：最佳实践和技巧

Ansible 自动化运维实践

MongoDB学习和应用(高效的非关系型数据库)

遍历 Map 类型集合的方法汇总

FastAPI 教程：从入门到实践

c++ 面试题(1)-----深度优先搜索（DFS）实现

CocosCreator 之 JavaScript/TypeScript和Java的相互交互

高防服务器能够抵御哪些网络攻击呢？

OpenLayers 分屏对比(地图联动)

AspectJ 在 Android 中的完整使用指南

STM32---外部32.768K晶振（LSE）无法起振问题

Web后端基础(基础知识)