当前位置：首页 > news >正文

【动手学深度学习Pytorch】2. Softmax回归代码

news 2026/2/8 17:18:13

零实现

导入所需要的包：

import torch
from IPython import display
from d2l import torch as d2l

定义数据集参数、模型参数：

batch_size = 256 # 每次随机读取256张图片
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
# 将展平每个图片将其视为长度为784的向量,数据集存在10个类别
num_inputs = 784
num_outputs = 10
W = torch.normal(0, 0.01, size=(num_inputs, num_outputs), requires_grad=True)
b = torch.zeros(num_outputs, requires_grad=True)

实现Softmax操作：

# 实现Softmax
def softmax(X):X_exp = torch.exp(X)partition = X_exp.sum(1, keepdim=True) #列数为特征数，行数为样本数return X_exp / partition #广播机制# 尝试进行Softmax操作
X = torch.normal(0, 1, (2,5))
X_prob = softmax(X)
X_prob, X_prob.sum(1)# 实现Softmax回归模型
def net(X):return softmax(torch.matmul(X.reshape(-1,W.shape[0]),W)+b)

定义交叉熵函数：

# 创建一个数据y_hat，其中包含2个样本在3个类别的预测概率,使用y作为y_hat中概率的索引
y = torch.tensor([0,2])
y_hat = torch.tensor([[0.1, 0.3, 0.6],[0.3, 0.2, 0.5]])
y_hat[[0, 1], y]
# 交叉熵函数
def cross_entropy(y_hat, y):return -torch.log(y_hat[range(len(y_hat)),y])
cross_entropy(y_hat, y)

将预测类别于真实元素进行比较：

torch.argmax(input, dim=None, keepdim=False)：用于返回指定维度中最大值的索引。通常用于分类任务中从预测输出中找到概率最大的类别

.dtype：.dtype 是张量的属性，用于返回该张量的 数据类型 (data type)。每个张量都有一个数据类型，用于定义其中存储元素的类型，例如浮点数、整数或布尔值。

tensor.type(dtype=None)：不传入参数时，返回一个字符串，表示张量的类型；传入参数时，返回一个新的张量，该张量的类型与指定类型匹配。
x = torch.tensor([1.0, 2.0, 3.0])  # 默认 float32 类型
print(x.type())  # 输出: torch.FloatTensorx_int = x.type(torch.int64)
print(x_int)         # 输出: tensor([1, 2, 3])
print(x_int.type())  # 输出: torch.LongTensor (int64 的别名)
net.eval()：设置为评估模式。

def accuracy(y_hat, y):#计算预测争取的数量# 判断 y_hat 是否为多维张量（例如二维）if len(y_hat.shape)>1 and y_hat.shape[1] > 1:# 如果是多类别分类（第二维大于 1），通过argmax获取每行中概率或分数最大的类别索引y_hat = y_hat.argmax(axis=1)cmp = y_hat.type(y.dtype)==y  # 比较预测结果和真实标签是否相等return float(cmp.type(y.dtype).sum()) # 返回预测正确的总数量accuracy(y_hat, y) / len(y)def evaluate_accuracy(net, data_iter):#计算在指定数据集上的模型精度# 如果是 PyTorch 模型，设置为评估模式if isinstance(net, torch.nn.Module):net.eval() metric = Accumulator(2)  # 初始化累加器，存储 [正确预测数, 总样本数]for X, y in data_iter:metric.add(accuracy(net(X), y), y.numel()) # 累加每批数据的预测结果return metric[0] / metric[1]  # 返回精度：正确预测数 / 总样本数

Accumulator实例：

class Accumulator: #在n个变量上累加def __init__(self, n):self.data = [0.0] * ndef add(self, *args):self.data = [a + float(b) for a, b in zip(self.data, args)]def reset(self):self.data = [0.0] * len(self.data)def __getitem__(self, idx):return self.data[idx]evaluate_accuracy(net, test_iter)

定义训练过程：

net.train()：设置为训练模式。

torch.optim.Optimizer.step()：用于执行模型参数更新。基于之前计算好的梯度（通过反向传播获得），按照优化算法的规则调整模型参数的值，以最小化损失函数。

def train_epoch_ch3(net, train_iter, loss, updater):if isinstance(net, torch.nn.Module):net.train()metric = Accumulator(3)for X, y in train_iter:y_hat = net(X)l = loss(y_hat, y) #计算损失if isinstance(updater, torch.optim.Optimizer):updater.zero_grad() # 清除梯度l.backward() # 反向传播计算梯度updater.step() # 根据梯度更新模型参数metric.add(float(l) * len(y),  # 累加当前批次的损失accuracy(y_hat, y),  # 累加当前批次的正确预测数y.size().numel())  # 累加当前批次的样本数else: # 如果是自定义优化器l.sum().backward()updater(X.shape[0]) # 自定义的更新函数，可能需要批次大小作为参数metric.add(float(l.sum()), accuracy(y_hat),y.numel())return metric[0] / metric[2], metric[1] / metric[2]

定义一个在动画中绘制数据的实用程序类：

class Animator: #实时观看在训练过程中的变化# 初始化绘图环境，包括图表的设置、标签、坐标轴范围、曲线样式等。def __init__(self, xlabel=None, ylabel=None, legend=None, xlim=None,ylim=None, xscale='linear', yscale='linear',fmts=('-','m--','g-','r:'),nrows=1,ncols=1,figsize=(3.5, 2,5)):if legend is None:legend = []d2l.use_svg_display()self.fig, self.axes = plt.subplots(nrows, ncols, figsize=figsize)if nrows * ncols ==1:self.axes = [self.axes,]self.config_axes = lambda:d2l.set_axes(self.axes[0],xlabel, ylabel,xlim, ylim,xscale, yscale,legend)self.X, self.Y, self.fmt = None, None, fmtsdef add(self, x, y):if not hasattr(y, "__len__"):y = [y]n = len(y)

训练函数：

# 训练函数
def train_ch3(net, train_iter, test_iter, loss, num_epochs, updater):# 进行可视化animator = Aminator(xlabel='epoch', xlim=[1, num_epochs], ylim=[0.3,],legend=['train loss','train acc','test acc'])for epoch in range(num_epochs):train_metrics = train_epoch_ch2(net, train_iter, loss, updater)test_acc = evaluate_accuracy(net, test_iter)animator.add(epoch+1, train_metrics+(test_acc,))train_loss, train_acc = train_metrics# 小批量随机梯度下降来优化训练算法
lr = 0.1
def updater(batch_size):return d2l.sgd([W,b],lr,batch_size)num_epochs = 10
train_ch3(net, train_iter, test_iter, cross_entropy, num_epochs, updater(10))

简洁实现

导入所需要的包：

import torch
from IPython import display
from d2l import torch as d2l

初始化数据集、模型参数、损失函数以及训练优化算法：网络加入高斯噪声，增强泛化性。

torch.nn.init.normal_(tensor, mean=0.0, std=1.0)：正态分布（高斯分布）随机初始化张量的值

nn.Sequential(*modules)：用于将多个模块（如线性层、激活函数等）按顺序组合成一个模型。适合简单的前向计算场景。

nn.Flatten(start_dim=1, end_dim=-1)：将输入张量展平成二维张量，适用于线性层输入。

nn.Linear(in_features, out_features, bias=True)：实现一个线性层（全连接层）

nn.CrossEntropyLoss(weight=None, ignore_index=-100, reduction='mean')：计算分类任务中的交叉熵损失（适用于多分类问题）。
torch.optim.SGD(params, lr=<required parameter>, momentum=0, dampening=0, weight_decay=0, nesterov=False)：实现随机梯度下降（SGD）优化算法，用于更新模型参数。

net.parameters()：返回模型的可训练参数的迭代器。

batch_size = 256 # 每次随机读取256张图片
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)net = nn.Sequential(nn.Flatten(),nn.Linear(784, 100))
def init_weights(m):if type(m) == nn.Linear:nn.init.normal_(m.weight, std=0.01)net.apply(init_weights);loss = nn.CrossEntropyLoss()trainer = torch.optim.SGD(net.parameters(),lr=0.1)

用之前定义的训练函数训练模型：

num_epochs = 10
train_ch3(net, train_iter, test_iter, cross_entropy, num_epochs, updater(10))

【动手学深度学习Pytorch】2. Softmax回归代码

零实现导入所需要的包： import torch from IPython import display from d2l import torch as d2l定义数据集参数、模型参数： batch_size 256 # 每次随机读取256张图片 train_iter, test_iter d2l.load_data_fashion_mnist(batch_size) # 将展平每个…...

编程日记 2024/11/18 14:42:34

技术周总结 11.11~11.17 周日(Js JVM XML)

文章目录一、11.11 周一1.1）问题01：js中的prompt弹窗区分出来用户点击的是确认还是取消进一步示例 1.2）问题02：在 prompt弹窗弹出时默认给弹窗中写入一些内容二、11.12 周二2.1) 问题02: 详解JVM中的本地方法栈本地方法栈的主要…...

编程日记 2024/11/18 14:39:30

MATLAB 使用教程 —— 矩阵和数组

矩阵和数组MATLAB 中矩阵和数组长什么样？MATLAB 怎么用矩阵计算？创建和操作矩阵矩阵运算示例串联访问矩阵的元素矩阵和数组 MATLAB 是“matrix laboratory”的缩写形式。MATLAB 主要用于处理整个的矩阵和数组，而其他编程语言大多逐个处理…...

编程日记 2024/11/18 14:36:26

React教程第二节之虚拟DOM与Diffing算法理解

1、什么是虚拟DOM 虚拟DOM 是javascript的一个对象，是内存中的一种数据结构，以树的形式存储UI的状态，树中的每个节点都代表着真实的DOM，用来描述我们希望在页面看到的 HTML结构； 现在的MVVM 框架，大多使用…...

编程日记 2024/11/18 14:34:21

C++——类和对象（part2）

前言本篇博客继续为大家介绍类与对象的知识，承接part1的内容，本篇内容是类与对象的核心内容，稍微有些复杂，如果你对其感兴趣，请继续阅读，下面进入正文部分。 1. 类的默认成员函数默认成员函数就是用户…...

编程日记 2024/11/18 14:33:20

【FFmpeg系列】：音频处理

前言在多媒体处理领域，FFmpeg无疑是一个不可或缺的利器。它功能强大且高度灵活，能够轻松应对各种音频和视频处理任务，无论是简单的格式转换，还是复杂的音频编辑，都不在话下。然而，要想真正发挥FFmpeg的潜…...

编程日记 2024/11/18 14:32:19

Python绘制雪花

文章目录系列目录写在前面技术需求完整代码代码分析1. 代码初始化部分分析2. 雪花绘制核心逻辑分析3. 窗口保持部分分析4. 美学与几何特点总结写在后面系列目录序号直达链接爱心系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4…...

编程日记 2024/11/18 14:30:16

vue3 如何调用第三方npm包内部的 pinia 状态管理库方法

抛砖引玉: 如果在开发vue3项目是, 引用了npm第三方包 ,而且这个包内使用了Pinia 状态管理库,那我们如何去调用 npm内部的 Pinia 状态管理库呢? 实际遇到的问题: 今天在制作npm包时遇到的问题,之前Vue2版本的时候状态管理库用的Vuex ,当时调用npm包内的状态管理库很简单,直接引…...

编程日记 2024/11/18 14:28:13

uni-app快速入门（七）--组件路由跳转和API路由跳转及参数传递

uni-app有两种页面路由跳转模式，即使用navigator组件跳转和调用API跳转，API调转不要理解为调用后台接口的API，而是指脚本函数中使用跳转函数。一、组件路由跳转 1.1 打开新页面打开新页面使用组件的open-type"navigate",见下面…...

编程日记 2024/11/18 14:25:09

Flink升级程序和版本

Flink DataStream程序通常设计为长时间运行，如几周、几个月甚至几年。与所有长时间运行的服务一样，Flink streaming应用程序也需要维护，包括修复错误、实现改进或将应用程序迁移到更高版本的Flink集群。这里就来描述下如何更新Flink streaming应用程序，以及如何将正在运行…...

编程日记 2024/11/18 14:24:07

从0安装mysql server

安装 MySQL Server 首先，你需要在 Ubuntu 上安装 MySQL 服务器。运行以下命令来安装：sudo apt update sudo apt install mysql-server安装完成后，MySQL 服务会自动启动。你可以通过以下命令检查 MySQL 服务是否正在运行： sudo systemctl status mysql如果 MySQL 正在运行，…...

编程日记 2024/11/18 14:22:05

web安全测试渗透案例知识点总结（上）——小白入狱

目录一、Web安全渗透测试概念详解1. Web安全与渗透测试2. Web安全的主要攻击面与漏洞类型3. 渗透测试的基本流程二、知识点详细总结1. 常见Web漏洞分析2. 渗透测试常用工具及其功能三、具体案例教程案例1：SQL注入漏洞利用教程案例2：跨站脚本&#xff…...

编程日记 2024/11/18 14:21:03

PHP访问NetSuite REST Web Services

“同等看待欢乐和痛苦、得到和失去、胜利和失败、投入战斗。以此方式履行职责，你就不会招致任何罪恶。” -Bhagavad Gita 为了帮助PHP开发者快速起步，以REST Web Services方式打通与NetSuite的接口，我们答应给一个样例。但是我是不懂PHP的&a…...

编程日记 2024/11/18 14:19:58

【编译】多图解释什么是短语、直接短语、句柄、素短语、可归约串

一、什么是短语二、什么是“直接”短语？三、什么是句柄？四、什么是素短语？五、什么是最左素短语可归约串就是“最左素短语” 首先，这些概念都是相对于【句型】的，都是相对于【句型】的，都是相对于【句型】…...

编程日记 2024/11/18 14:18:57

React中事件绑定和Vue有什么区别？

1. 绑定方式 React：使用jsx语法，通过属性绑定事件。Vue：使用指令（如v-on）在模板中直接绑定事件。 2. 事件处理 React：通过合成事件系统封装原生事件，提供统一的API。Vue：直接使用…...

编程日记 2024/11/18 14:15:53

【DBA攻坚指南：左右Oracle，右手MySQL-学习总结】

处理log file sync等待事件首先明确什么是log file sync等待事件从用户提交会话开始，LGWR进程将redo缓存中的信息写入redo日志文件后，LGWR进程通知用户写操作完成，到用户会话接受到LGWR进程通知为止，这整个过程就是可能出现lo…...

编程日记 2024/11/18 14:14:51

C++中的内联函数

在C中，内联函数是一种特殊的函数。定义内联函数是在函数定义前加上关键字“inline”的函数。编译器在处理对内联函数的调用时，会尝试将函数体的代码直接插入到函数调用处，而不是像普通函数调用那样，进行跳转指令执行函数体代码…...

编程日记 2024/11/18 14:13:49

ssh.service could not be found“

如果你收到 “ssh.service could not be found” 错误，说明目标主机上没有安装 SSH 服务，或者安装的 SSH 服务的名称不为 ssh。这里有一些解决步骤： 1. 检查 SSH 服务是否已安装在目标主机上执行以下命令来检查是否安装了 SSH 服务&#x…...

编程日记 2024/11/18 14:08:44

tensorflow有哪些具体影响，和chatgpt有什么关系

### TensorFlow的影响 **1. 深度学习框架的领军者** - **广泛使用**: TensorFlow是由Google开发的开源深度学习框架，广泛应用于各种机器学习任务，包括图像识别、自然语言处理、语音识别等。它是深度学习领域中最受欢迎的框架之一。 - **大规模生产环境*…...

编程日记 2024/11/18 14:07:43

Android OpenGL ES详解——几何着色器

目录一、概念 1、图元 2、几何着色器 1、输入类型 2、输出类型 3、输出顶点数量最大值限制二、使用几何着色器三、应用举例——造几个房子四、应用举例——爆破物体 1、获取法向量 2、显示法线五、应用举例——细分三角形六、应用举例——广告牌技术一、概…...

编程日记 2024/11/18 14:04:39

铭豹扩展坞 USB转网口突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别，但在其他电脑上正常工作时，问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤，帮助你快速找到故障原因：背景：一个M-pard（铭豹）扩展坞的网卡突然无法识别了，扩展出来的三个USB接口正常。…...

编程新知 2026/2/8 4:37:22

Debian系统简介

目录 Debian系统介绍 Debian版本介绍 Debian软件源介绍软件包管理工具dpkg dpkg核心指令详解安装软件包卸载软件包查询软件包状态验证软件包完整性手动处理依赖关系 dpkg vs apt Debian系统介绍 Debian 和 Ubuntu 都是基于 Debian内核的 Linux 发行版&#xff…...

编程新知 2026/2/1 13:41:09

【SpringBoot】100、SpringBoot中使用自定义注解+AOP实现参数自动解密

在实际项目中，用户注册、登录、修改密码等操作，都涉及到参数传输安全问题。所以我们需要在前端对账户、密码等敏感信息加密传输，在后端接收到数据后能自动解密。 1、引入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId...

编程新知 2025/11/28 6:00:25

c++ 面试题(1)-----深度优先搜索（DFS）实现

操作系统：ubuntu22.04 IDE:Visual Studio Code 编程语言：C11 题目描述地上有一个 m 行 n 列的方格，从坐标 [0,0] 起始。一个机器人可以从某一格移动到上下左右四个格子，但不能进入行坐标和列坐标的数位之和大于 k 的格子。例…...

编程新知 2026/1/10 10:16:16

OkHttp 中实现断点续传 demo

在 OkHttp 中实现断点续传主要通过以下步骤完成，核心是利用 HTTP 协议的 Range 请求头指定下载范围： 实现原理 Range 请求头：向服务器请求文件的特定字节范围（如 Range: bytes1024-） 本地文件记录：保存已…...

编程新知 2025/12/12 0:56:22

拉力测试cuda pytorch 把 4070显卡拉满

import torch import timedef stress_test_gpu(matrix_size16384, duration300):"""对GPU进行压力测试，通过持续的矩阵乘法来最大化GPU利用率参数:matrix_size: 矩阵维度大小，增大可提高计算复杂度duration: 测试持续时间（秒&…...

编程新知 2025/12/7 12:35:20

CMake 从 GitHub 下载第三方库并使用

有时我们希望直接使用 GitHub 上的开源库，而不想手动下载、编译和安装。可以利用 CMake 提供的 FetchContent 模块来实现自动下载、构建和链接第三方库。 FetchContent 命令官方文档✅ 示例代码我们将以 fmt 这个流行的格式化库为例，演示如何：使用 FetchContent 从 GitH…...

编程新知 2026/2/1 3:19:54

听写流程自动化实践，轻量级教育辅助

随着智能教育工具的发展，越来越多的传统学习方式正在被数字化、自动化所优化。听写作为语文、英语等学科中重要的基础训练形式，也迎来了更高效的解决方案。这是一款轻量但功能强大的听写辅助工具。它是基于本地词库与可选在线语音引擎构建，…...

编程新知 2026/1/30 1:47:17

以光量子为例，详解量子获取方式

光量子技术获取量子比特可在室温下进行。该方式有望通过与名为硅光子学（silicon photonics）的光波导（optical waveguide）芯片制造技术和光纤等光通信技术相结合来实现量子计算机。量子力学中，光既是波又是粒子。光子本…...

编程新知 2026/2/7 11:51:32

Mysql8 忘记密码重置，以及问题解决

1.使用免密登录找到配置MySQL文件，我的文件路径是/etc/mysql/my.cnf，有的人的是/etc/mysql/mysql.cnf 在里最后加入 skip-grant-tables重启MySQL服务 service mysql restartShutting down MySQL… SUCCESS! Starting MySQL… SUCCESS! 重启成功 2.登…...

编程新知 2026/1/9 8:59:09

零实现

简洁实现

相关文章：