当前位置：首页 > news >正文

PyTorch 的各个核心模块和它们的功能

news 2026/2/8 14:32:59

1. `torch`

核心功能

张量操作：PyTorch 的张量是一个多维数组，类似于 NumPy 的 ndarray，但支持 GPU 加速。
数学运算：提供了各种数学运算，包括线性代数操作、随机数生成等。
自动微分：torch.autograd 模块用于自动计算梯度。
设备管理：允许在 CPU 和 GPU 之间移动张量。

示例代码：

import torch# 创建张量
x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)
y = torch.tensor([4.0, 5.0, 6.0])# 张量加法
z = x + y
print(f'z: {z}')# 计算梯度
z.sum().backward() # 求和的原因是求梯度需要是一个标量
print(f'Gradients of x: {x.grad}')

2. `torch.nn`

核心功能

构建神经网络模块：nn.Module 是所有神经网络模块的基类。
常用层：如卷积层、池化层、全连接层、激活函数、归一化层等。
损失函数：如交叉熵损失、均方误差损失等。

示例代码：

import torch.nn as nn# 定义一个简单的前馈神经网络
class SimpleNet(nn.Module):def __init__(self):super(SimpleNet, self).__init__()self.fc1 = nn.Linear(10, 5)self.fc2 = nn.Linear(5, 1)def forward(self, x):x = torch.relu(self.fc1(x))x = self.fc2(x)return xmodel = SimpleNet()
print(model)

3. `torch.optim`

核心功能

优化算法：包括 SGD、Adam、RMSprop 等。
学习率调度器：用于动态调整学习率，如 StepLR、ExponentialLR。

示例代码：

import torch.optim as optim# 定义模型
model = SimpleNet()# 定义优化器
optimizer = optim.Adam(model.parameters(), lr=0.001)# 更新模型参数
optimizer.zero_grad()
output = model(torch.randn(1, 10))
loss = torch.mean(output)
loss.backward()
optimizer.step()# 学习率调度器
scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=10, gamma=0.1)
scheduler.step()

4. `torch.utils.data`

核心功能

数据集：Dataset 类用于自定义数据集。
数据加载器：DataLoader 用于批量加载数据，支持多线程加载。
数据变换：通过 torchvision.transforms 可以对数据进行预处理和增强。

示例代码：

from torch.utils.data import Dataset, DataLoader# 自定义数据集
class MyDataset(Dataset):def __init__(self, data):self.data = datadef __len__(self):return len(self.data)def __getitem__(self, idx):return self.data[idx]dataset = MyDataset([1, 2, 3, 4])
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)for batch in dataloader:print(batch)

5. `torchvision`

核心功能

数据集：提供了常用的计算机视觉数据集，如 MNIST、CIFAR-10、ImageNet 等。
预训练模型：如 ResNet、VGG、AlexNet 等。
数据变换：如图像调整大小、裁剪、归一化等。

示例代码：

import torchvision.transforms as transforms
import torchvision.datasets as datasets# 定义数据预处理
transform = transforms.Compose([transforms.Resize((32, 32)),transforms.ToTensor(),transforms.Normalize((0.5,), (0.5,))
])# 下载 MNIST 数据集
dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
dataloader = DataLoader(dataset, batch_size=64, shuffle=True)for images, labels in dataloader:print(images.shape, labels.shape)break

6. `torch.jit`

核心功能

TorchScript：通过脚本化和追踪将 Python 模型转换为 TorchScript 模型，提高执行效率并支持跨平台部署。
脚本化：torch.jit.script 用于将 Python 代码转换为 TorchScript 代码。
追踪：torch.jit.trace 用于通过追踪模型的执行流程创建 TorchScript 模型。

示例代码：

import torch.jit# 定义简单模型
class SimpleNet(nn.Module):def forward(self, x):return x * 2model = SimpleNet()# 脚本化模型
scripted_model = torch.jit.script(model)
print(scripted_model)# 追踪模型
traced_model = torch.jit.trace(model, torch.randn(1, 10))
print(traced_model)

7. `torch.cuda`

核心功能

设备管理：提供与 GPU 相关的操作，如设备计数、设备选择等。
张量迁移：将张量从 CPU 移动到 GPU，以利用 GPU 加速计算。

示例代码：

if torch.cuda.is_available():device = torch.device("cuda")x = torch.tensor([1.0, 2.0, 3.0]).to(device)print(f'GPU tensor: {x}')
else:print("CUDA is not available.")

8. `torch.autograd`

核心功能

自动微分：提供自动计算梯度的功能，支持反向传播算法。
计算图：动态构建计算图，并根据图计算梯度。

示例代码：

x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)
y = x + 2
z = y * y * 3
out = z.mean()# 反向传播计算梯度
out.backward()
print(x.grad)  # 输出 x 的梯度

9. `torch.multiprocessing`

核心功能

多进程并行：用于在多核 CPU 上实现数据并行和模型并行，提高计算效率。
与 Python 标准库 multiprocessing 的兼容：提供与标准库相似的接口。

示例代码：

import torch.multiprocessing as mpdef worker(rank, data):print(f'Worker {rank} processing data: {data}')if __name__ == '__main__':data = [1, 2, 3, 4]mp.spawn(worker, args=(data,), nprocs=4)

10. `torch.distributed`

核心功能

分布式训练：支持在多个 GPU 和多台机器上进行分布式训练。
通信接口：提供多种通信后端，如 Gloo、NCCL 等。

示例代码：

import torch
import torch.distributed as distdef init_process(rank, size, fn, backend='gloo'):dist.init_process_group(backend, rank=rank, world_size=size)fn(rank, size)def example(rank, size):tensor = torch.zeros(1)if rank == 0:tensor += 1dist.send(tensor, dst=1)else:dist.recv(tensor, src=0)print(f'Rank {rank} has data {tensor[0]}')if __name__ == "__main__":size = 2processes = []for rank in range(size):p = mp.Process(target=init_process, args=(rank, size, example))p.start()processes.append(p)for p in processes:p.join()

通过这些模块，PyTorch 提供了构建、训练、优化和部署深度学习模型所需的全面支持。

PyTorch 的各个核心模块和它们的功能

1. torch 核心功能张量操作：PyTorch 的张量是一个多维数组，类似于 NumPy 的 ndarray，但支持 GPU 加速。数学运算：提供了各种数学运算，包括线性代数操作、随机数生成等。自动微分：torch.autograd 模块用于…...

编程日记 2024/7/25 16:22:14

Java开发之LinkedList源码分析

#来自ゾフィー（佐菲） 1 简介 LinkedList 的底层数据结构是双向链表。可以当作链表、栈、队列、双端队列来使用。有以下特点： 在插入或删除数据时，性能好；允许有 null 值；查询效率不高；线程不安…...

编程日记 2024/7/25 16:18:53

外卖霸王餐系统架构怎么选？

在当今日益繁荣的外卖市场中，外卖霸王餐作为一种独特的营销策略，受到了众多商家的青睐。然而，要想成功实施外卖霸王餐活动，一个安全、稳定且高效的架构选择至关重要。本文将深入探讨外卖霸王餐架构的选择，以期为商家提…...

编程日记 2024/7/25 16:15:29

AV1技术学习：Transform Coding

对预测残差进行变换编码，去除潜在的空间相关性。VP9 采用统一的变换块大小设计，编码块中的所有的块共享相同的变换大小。VP9 支持 4 4、8 8、16 16、32 32 四种正方形变换大小。根据预测模式选择由一维离散余弦变换 (DCT) 和非对称离散正弦变换 (ADS…...

编程日记 2024/7/25 16:09:20

Git操作指令

Git操作指令一、安装git 1、设置配置信息： # global全局配置 git config --global user.name "Your username" git config --global user.email "Your email"2、查看git版本号 git -v # or git --version3、查看配置信息： git…...

编程日记 2024/7/25 16:03:10

CSS 创建：从入门到精通

CSS 创建：从入门到精通 CSS（层叠样式表）是网页设计中不可或缺的一部分，它用于控制网页的布局和样式。本文将详细介绍CSS的创建过程，包括基本概念、语法结构、选择器、样式属性以及如何将CSS应用到HTML中。无论您是初学者还是有经验的开发者，本文都将为您提供宝贵的信息。…...

编程日记 2024/7/25 16:02:09

Windows 11 系统对磁盘进行分区保姆级教程

Windows 11磁盘分区磁盘分区是将硬盘驱动器划分为多个逻辑部分的过程，每个逻辑部分都可以独立使用和管理。在Windows 11操作系统中进行磁盘分区主要有以下几个作用和意义： 组织和管理数据：分区可以帮助用户更好地组织他们的数据&#xff0c…...

编程日记 2024/7/25 15:59:05

探索WebKit的CSS盒模型：深入理解Web布局的基石

探索WebKit的CSS盒模型：深入理解Web布局的基石在Web开发的世界中，CSS盒模型（Box Model）是构建网页布局的核心原理。WebKit，作为Safari浏览器的渲染引擎，对CSS盒模型有着深入而精确的支持。本文将带你深入…...

编程日记 2024/7/25 15:57:03

c＋＋初阶知识——string类详解

目录前言： 1.标准库中的string类 1.1 auto和范围for auto 范围for 1.2 string类常用接口说明 1.string类对象的常见构造 1.3 string类对象的访问及遍历操作 1.4. string类对象的修改操作 1.5 string类非成员函数 2.string类的模拟实现 2.1 经典的string…...

编程日记 2024/7/25 15:53:59

php接口返回的json字符串，json_decode()失败，原来是多了红点

问题： 调用某个接口返回的json，json_decode()失败，返回数据为null， echo json_last_error();返回错误码 4 经过多次调试发现：多出来一个红点，预览是看不到的。解决：要去除BOM头部 $resul…...

编程日记 2024/7/25 15:51:57

文章目录一、urllib1. urlparse 实现 URL 的识别和分段2. urlunparse 用于构造 URL3. urljoin 用于两个链接的拼接4. urlencode 将 params 字典序列化为 params 字符串5. parse_qs 和 parse_qsl 用于将 params 字符串反序列化为 params 字典或列表6. quote 和 unquote 对 URL的…...

编程日记 2024/7/25 15:50:55

el-image预览图片点击遮盖处关闭预览

预览关闭按钮不明显解决方式： 1.修改按钮样式明显点： //el-image 添加自定义类名，下文【test-image】代指 .test-image .el-icon-circle-close{ color:#fff; font-size:20px; ...改成很明显的样式 }2.使用事件监听，监听当前遮…...

编程日记 2024/7/25 15:47:52

基于Neo4j将知识图谱用于检索增强生成：Knowledge Graphs for RAG

Knowledge Graphs for RAG 本文是学习https://www.deeplearning.ai/short-courses/knowledge-graphs-rag/这门课的学习笔记。 What you’ll learn in this course Knowledge graphs are used in development to structure complex data relationships, drive intelligent sea…...

编程日记 2024/7/25 15:46:51

康康近期的慢SQL（oracle vs 达梦）

近期执行的sql，哪些比较慢？ 或者健康检查时搂一眼状态 oracle： --最近3天内的慢sql set lines 200 pages 100 col txt for a65 col sql_id for a13 select a.sql_id,a.cnt,a.pctload,b.sql_text txt from (select * from (select sql_id,co…...

编程日记 2024/7/25 15:44:48

探索 GPT-4o mini：成本效益与创新的双重驱动

💝💝💝欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan 的首页,持续学…...

编程日记 2024/7/25 15:40:42

2.6基本算法之动态规划2989:糖果

描述由于在维护世界和平的事务中做出巨大贡献，Dzx被赠予糖果公司2010年5月23日当天无限量糖果免费优惠券。在这一天，Dzx可以从糖果公司的N件产品中任意选择若干件带回家享用。糖果公司的N件产品每件都包含数量不同的糖果。Dzx希望他选择的产品包含的糖…...

编程日记 2024/7/25 15:39:40

12.顶部带三角形的边框 CSS 关键字 currentColor

顶部带三角形的边框创建一个在顶部带有三角形的内容容器。使用 ::before 和 ::after 伪元素创建两个三角形。两个三角形的颜色应分别与容器的 border-color 和容器的 background-color 相同。一个三角形(::before)的 border-width 应比另一个(::after)宽 1px,以起到边框的作…...

编程日记 2024/7/25 15:37:37

Llama中模块参数大小

LLama2中，流程中数据大小的变换如下 Transformer模块第一次输入，进行prefill，输入x维度为[1, 8, 4096] 1. 构建wq,wk,wv,wo,尺寸均为[4096,4096]， 与x点乘，得到xq, xk, xv 2. 构建KV cache， 尺寸为 [b…...

编程日记 2024/7/25 15:33:30

Modbus转EtherCAT网关将Modbus协议的数据格式转换为EtherCAT协议

随着工业自动化技术的快速发展，不同通信协议之间的互操作性变得越来越重要。Modbus作为一种广泛使用的串行通信协议，与以太网为基础的EtherCAT协议之间的转换需求日益增长。本文将从网关功能、硬件设计、性能以及应用案例来介绍这款Modbus转EtherCAT网关…...

编程日记 2024/7/25 15:30:26

【开发实战】QT5 + OpenCV4 开发环境配置应用演示

前言作为深度学习算法工程师，必须要掌握应用开发技能吗？搞工程肯定是必须要会界面开发，QT就是一个很不错的选择。本文以QT5.15 OpenCV4.8 OpenVINO2023为例，搭建应用开发环境，演示深度学习模型的QT应用案例。开发…...

编程日记 2024/7/25 15:27:22

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向深度学习与微纳光子学的结合主要集中在以下几个方向： 逆向设计通过神经网络快速预测微纳结构的光学响应，替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。特征提取与优化从复杂的光学数据中自…...

编程新知 2026/2/7 4:19:43

基于大模型的 UI 自动化系统

基于大模型的 UI 自动化系统下面是一个完整的 Python 系统，利用大模型实现智能 UI 自动化，结合计算机视觉和自然语言处理技术，实现"看屏操作"的能力。系统架构设计 #mermaid-svg-2gn2GRvh5WCP2ktF {font-family:"trebuchet ms",verdana,arial,sans-…...

编程新知 2025/10/22 11:16:20

C++初阶-list的底层

目录 1.std::list实现的所有代码 2.list的简单介绍 2.1实现list的类 2.2_list_iterator的实现 2.2.1_list_iterator实现的原因和好处 2.2.2_list_iterator实现 2.3_list_node的实现 2.3.1. 避免递归的模板依赖 2.3.2. 内存布局一致性 2.3.3. 类型安全的替代方案 2.3.…...

编程新知 2026/2/4 17:44:58

vscode（仍待补充）

写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用侧边栏 vscode还能连接ssh？ debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

编程新知 2026/1/24 13:04:10

高危文件识别的常用算法：原理、应用与企业场景

高危文件识别的常用算法：原理、应用与企业场景高危文件识别旨在检测可能导致安全威胁的文件，如包含恶意代码、敏感数据或欺诈内容的文档，在企业协同办公环境中（如Teams、Google Workspace）尤为重要。结合大模型技术&…...

编程新知 2026/2/8 10:51:42

DeepSeek 技术赋能无人农场协同作业：用 AI 重构农田管理 “神经网”

目录一、引言二、DeepSeek 技术大揭秘2.1 核心架构解析2.2 关键技术剖析三、智能农业无人农场协同作业现状3.1 发展现状概述3.2 协同作业模式介绍四、DeepSeek 的 “农场奇妙游”4.1 数据处理与分析4.2 作物生长监测与预测4.3 病虫害防治4.4 农机协同作业调度五、实际案例大…...

编程新知 2025/9/24 13:35:36