当前位置：首页 > news >正文

【动手学深度学习Pytorch】1. 线性回归代码

news 2026/2/8 11:37:54

零实现

导入所需要的包：

# %matplotlib inline
import random
import torch
from d2l import torch as d2l
import matplotlib.pyplot as plt
import matplotlib
import os

构造人造数据集：假设w=[2, -3.4]，b=4.2，存在随机噪音（均值为0，方差为0.001的正态分布噪声），函数拟合为 $y = w^{T}X + b + n$ 。在构造数据集的过程中，首先X为正态分布（均值为0，方差为1，样本数/行数为num_examples，列数为len(w)）

torch.normal(mean, std, *, generator=None, out=None)：生成指定输出尺寸的正态分布随机数张量

torch.mv()：矩阵和向量的乘积，此处X为矩阵，w为向量

def synthetic_data(w, b, num_examples):X = torch.normal(0, 1, (num_examples, len(w))) #均值为0方差为1的随机数,样本数,列数y = torch.mv(X, w) + b #y关于x的公式y += torch.normal(0, 0.001, y.shape) # 加入噪声项return X, y.reshape((-1,1)) #做成列向量返回
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = synthetic_data(true_w, true_b, 1000)

查看数据集样本分布：

matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, *, edgecolors=None, plotnonfinite=False, data=None, **kwargs):

        x，y：长度相同的数组，也就是我们即将绘制散点图的数据点，输入数据。

        s：点的大小，默认 20，也可以是个数组，数组每个参数为对应点的大小。

        c：点的颜色，默认蓝色 'b'，也可以是个 RGB 或 RGBA 二维行数组。

        marker：点的样式，默认小圆圈 'o'。

        cmap：Colormap，默认 None，标量或者是一个 colormap 的名字，只有 c 是一个浮点数数组的时才使用。如果没有申明就是 image.cmap。

        norm：Normalize，默认 None，数据亮度在 0-1 之间，只有 c 是一个浮点数的数组的时才使用。

        vmin，vmax：亮度设置，在 norm 参数存在时会忽略。

        alpha：透明度设置，0-1 之间，默认 None，即不透明。

        linewidths：标记点的长度。

        edgecolors：颜色或颜色序列，默认为 'face'，可选值有 'face', 'none', None。

        plotnonfinite：布尔值，设置是否使用非限定的 c ( inf, -inf 或 nan) 绘制点。

        **kwargs：其他参数。

detach()：允许我们从计算图中分离出张量。当对一个张量调用detach()方法时，它会创建一个新的张量，这个新张量与原始张量共享数据，但它不再参与计算图的任何操作，对分离后的张量进行的任何操作都不会影响原始张量，也不会在计算图中留下任何痕迹。

plt.scatter(features[:,(1)].detach().numpy(),labels.detach().numpy(),1);
plt.show()

遍历数据集，输出数据集内容：

len(): 返回对象（字符、列表、元组等）长度或项目个数（此处是张量的行数）

list(): 将元组转换为列表

range()：创建一个整数列表

shuffle(): 随机打乱列表

def data_iter(batch_size, features, labels):num_examples = len(features)indices = list(range(num_examples)) #生成样本索引random.shuffle(indices) #样本随机读取没有特定顺序# 进行batch划分for i in range(0, num_examples, batch_size): #从i开始到i+batchsizebatch_indices =  torch.tensor(indices[i:min(i + batch_size, num_examples)])# 截取切片：开始位置为i，结束位置为min函数的返回值# 返回值为i+batch_size和num_examples的值比较小的那个yield features[batch_indices], labels[batch_indices] #产生随机顺序的特征&标号batch_size = 10for X, y in data_iter(batch_size, features, labels):print(X, '\n', y)break

定义参数、模型、损失函数以及优化算法：

torch.mutual()：矩阵相乘

with torch.no_grad()：所有计算得出的tensor的requires_grad都自动设置为False，不会进行自动求导

grad.zero_()：将梯度置零（不然会发生累计的情况）

# 定义初始化模型参数
w = torch.normal(0, 0.01, size=(2,1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)
# 定义模型
def linreg(X, w, b):return torch.matmul(X, w) + b
# 定义损失函数
def squared_loss(y_hat, y):return (y_hat - y.reshape(y_hat.shape))**2/2
# 定义优化算法
def sgd(params, lr, batch_size):with torch.no_grad():for param in params:param -= lr * param.grad / batch_sizeparam.grad.zero_()

定义训练过程：

# 训练过程
lr = 0.01
num_epochs = 10
net = linreg
loss = squared_lossfor epoch in range(num_epochs):for X, y in data_iter(batch_size, features, labels):l = loss(net(X, w, b), y)l.sum().backward()sgd([w,b], lr, batch_size)with torch.no_grad():train_1= loss(net(features, w, b), labels)print(f'epoch{epoch + 1}, loss{float(train_1.mean()):f}')

简介实现

导入所需要的包：

import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l
import matplotlib.pyplot as plt

创建人造数据集：

data.TensorDataset()：将数据进行封装

data.DataLoader()：将数据分批次处理

iter()：获取列表的迭代器

next()：获取下一个值

true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b,1000)
def load_array(data_arrays, batch_size, is_train=True):dataset = data.TensorDataset(*data_arrays)return data.DataLoader(dataset, batch_size, shuffle=is_train)batch_size = 10
data_iter = load_array((features, labels), batch_size)next(iter(data_iter))

初始化模型、模型参数、loss：

nn.Sequential()：实现模型层结构的简单排序

torch.optim.SGD()：定义优化算法

torch.optim.SGD().step()：进行模型的更新

# 使用框架的预定义好的层
from torch import nn
net = nn.Sequential(nn.Linear(2,1))
# 初始化模型参数
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)
# 计算均方误差使用的是MSELoss类
loss = nn.MSELoss()
trainer = torch.optim.SGD(net.parameters(),lr=0.01)

定义训练过程：

num_epochs = 3
for epoch in range(num_epochs):for X, y in data_iter:l = loss(net(X), y)trainer.zero_grad()l.backward()trainer.step()l = loss(net(features), labels)print(f'epoch{epoch + 1}, loss{1:f}')

【动手学深度学习Pytorch】1. 线性回归代码

零实现导入所需要的包： # %matplotlib inline import random import torch from d2l import torch as d2l import matplotlib.pyplot as plt import matplotlib import os构造人造数据集：假设w[2, -3.4]，b4.2，存在随机噪音&…...

编程日记 2024/11/21 23:29:18

深入理解PyTorch中的卷积层：工作原理、参数解析与实际应用示例

深入理解PyTorch中的卷积层：工作原理、参数解析与实际应用示例在PyTorch中，卷积层是构建卷积神经网络（CNNs）的基本单元，广泛用于处理图像和视频中的特征提取任务。通过卷积操作，网络可以有效地学习输入数…...

编程日记 2024/11/21 23:25:14

DataGear 5.2.0 发布，数据可视化分析平台

DataGear 企业版 1.3.0 已发布，欢迎体验！ http://datagear.tech/pro/ DataGear 5.2.0 发布，图表插件支持定义依赖库、严重 BUG 修复、功能改进、安全增强，具体更新内容如下： 重构：各模块管理功能访问路径…...

编程日记 2024/11/21 23:24:13

uniapp: vite配置rollup-plugin-visualizer进行小程序依赖可视化分析减少vender.js大小

一、前言在之前文章《uniapp: 微信小程序包体积超过2M的优化方法（主包从2.7M优化到1.5M以内）》中，提到了6种优化小程序包体积的方法，但并没有涉及如何分析common/vender.js这个文件的优化，而这个文件的大小通常情况下…...

编程日记 2024/11/21 23:22:11

深度学习：如何复现神经网络

深度学习：如何复现神经网络要复现图中展示的卷积神经网络（CNN），我们需详细了解和配置每层网络的功能与设计理由。以下将具体解释各层的配置以及设计选择的原因，确保网络设计的合理性与有效性。详细的网络层配置与设…...

编程日记 2024/11/21 23:20:08

Spring Boot与MyBatis-Plus的高效集成

Spring Boot与MyBatis-Plus的高效集成引言在现代 Java 开发中，MyBatis-Plus 作为 MyBatis 的增强工具，以其简化 CRUD 操作和无需编写 XML 映射文件的特点，受到了开发者的青睐。本篇文章将带你一步步整合 Spring Boot 与 MyBatis-Plus&…...

编程日记 2024/11/21 23:17:04

【Unity ShaderGraph实现流体效果之Function入门】

Unity ShaderGraph实现流体效果之Node入门（一） 前言Shader Graph NodePosition NodeSplit NodeSubtract NodeBranch Node 总结前言 Unity 提供的Shader Graph在很大程度上简化了开发者对于编写Shader的工作，只需要拖拽即可完成一个视觉效果…...

编程日记 2024/11/21 23:16:02

Spark RDD sortBy算子执行时进行数据 “采样”是什么意思？

一、sortBy 和 RangePartitioner sortBy 在 Spark 中会在执行排序时采用 rangePartitioner 进行分区，这会影响数据的分区方式，并且这一步骤是通过对数据进行 “采样” 来计算分区的范围。不过，重要的是，sortBy 本身仍然是一个 tr…...

编程日记 2024/11/21 23:15:01

React-useRef与DOM操作

#题引：我认为跟着官方文档学习不会走歪路 ref使用组件重新渲染时，react组件函数里的代码会重新执行，返回新的JSX，当你希望组件“记住”某些信息，但又不想让这些信息触发新的渲染时，你可以使用ref&#x…...

编程日记 2024/11/21 23:14:01

Mistral AI 发布 Pixtral Large 模型：多模态时代的开源先锋

Mistral AI 最新推出的 Pixtral Large 模型，带来了更强的多模态能力。作为一款开源的多模态模型，它不仅在参数量上达到 1240 亿，更在文本和图像理解上实现了质的飞跃。模型亮点 1. 多模态能力再升级 Pixtral Large 配备了 123B 参数的解码器…...

编程日记 2024/11/21 23:08:56

Windows、Linux多系统共享蓝牙设备

Windows、Linux多系统共享蓝牙设备近来遇到一个新问题，就是双系统共享蓝牙鼠标。因为一直喜欢在Windows、Linux双系统之间来回切换，而每次切换系统蓝牙就必须重新配对，当然，通过网络成功解决了问题。通过这个问题，稍…...

编程日记 2024/11/21 23:07:55

C语言 | Leetcode C语言题解之第564题寻找最近的回文数

题目： 题解： #define MAX_STR_LEN 32 typedef unsigned long long ULL;void reverseStr(char * str) {int n strlen(str);for (int l 0, r n-1; l < r; l, r--) {char c str[l];str[l] str[r];str[r] c;} }ULL * getCandidates(const char * n…...

编程日记 2024/11/21 23:05:53

wsl虚拟机中的dockers容器访问不了物理主机

1 首先保证wsl虚拟机能够访问宿主机IP地址，wsl虚拟机通过vEthernet (WSL)的地址访问，着意味着容器也要通过此IP地址访问物理主机。 2 遇到的问题：wsl虚拟机中安装了docker，用在用到docker容器内的开发环境，但是虚拟机…...

编程日记 2024/11/21 23:03:48

Spark RDD 的宽依赖和窄依赖

通俗地理解 Spark RDD 的宽依赖和窄依赖，可以通过以下比喻和解释： 1. 日常生活比喻假设你在管理多个团队完成工作任务： 窄依赖：每个团队只需要关注自己的分工，完成自己的任务。例如，一个人将纸张折好&…...

编程日记 2024/11/21 23:01:46

二进制转十进制

解题思路分析二进制转十进制原理：二进制数转换为十进制数的基本原理是按位权展开相加。对于一个二进制数，从右往左每一位的位权依次是将每一位上的数字（0 或 1）乘以其对应的位权，然后把所有结果相加，就得…...

编程日记 2024/11/21 23:00:45

深度学习：神经网络中的非线性激活的使用

深度学习：神经网络中的非线性激活的使用在神经网络中，非线性激活函数是至关重要的组件，它们使网络能够捕捉和模拟输入数据中的复杂非线性关系。这些激活函数的主要任务是帮助网络解决那些无法通过简单的线性操作（如权重相乘和偏…...

编程日记 2024/11/21 22:58:43

Python缓存：两个简单的方法

缓存是一种用于提高应用程序性能的技术，它通过临时存储程序获得的结果，以便在以后需要时重用它们。在本文中，我们将学习Python中的不同缓存技术，包括functools模块中的 lru_cache和 cache装饰器。简单示例：Python缓…...

编程日记 2024/11/21 22:55:40

原生微信小程序在顶部胶囊左侧水平设置自定义导航兼容各种手机模型

无论是在什么手机机型下，自定义的导航都和右侧的胶囊水平一条线上。如图下以上图iphone12，13PRo 以上图是没有带黑色扇帘的机型以下是调试器看的wxml的代码展示注意：红色阔里的是自定义导航（或者其他的logo啊，返回之…...

编程日记 2024/11/21 22:54:40

经验笔记：远端仓库和本地仓库之间的连接(以Gitee为例)

经验笔记：远端仓库和本地仓库之间的连接方法一：先创建远端仓库，再克隆到本地创建远端仓库登录到你的Git托管平台（如Gitee、GitHub、GitLab、Bitbucket等）。点击“New Repository”或类似按钮，创建一个新…...

编程日记 2024/11/21 22:52:37

利用RAGflow和LM Studio建立食品法规问答系统

前言食品企业在管理标准、法规，特别是食品原料、特殊食品法规时，难以通过速查法规得到准确的结果。随着AI技术的发展，互联网上出现很多AI知识库的解决方案。经过一轮测试，找到问题抓手、打通业务底层逻辑、对齐行业颗粒度、沉…...

编程日记 2024/11/21 22:49:35

【大模型RAG】拍照搜题技术架构速览：三层管道、两级检索、兜底大模型

摘要拍照搜题系统采用“三层管道（多模态 OCR → 语义检索 → 答案渲染）、两级检索（倒排 BM25 向量 HNSW）并以大语言模型兜底”的整体框架： 多模态 OCR 层将题目图片经过超分、去噪、倾斜校正后，分别用…...

编程新知 2026/2/8 4:32:38

iOS 26 携众系统重磅更新，但“苹果智能”仍与国行无缘

美国西海岸的夏天，再次被苹果点燃。一年一度的全球开发者大会 WWDC25 如期而至，这不仅是开发者的盛宴，更是全球数亿苹果用户翘首以盼的科技春晚。今年，苹果依旧为我们带来了全家桶式的系统更新，包括 iOS 26、iPadOS 26…...

编程新知 2026/2/6 10:39:49

label-studio的使用教程(导入本地路径)

文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...

编程新知 2026/2/7 20:40:53

VB.net复制Ntag213卡写入UID

本示例使用的发卡器：https://item.taobao.com/item.htm?ftt&id615391857885 一、读取旧Ntag卡的UID和数据 Private Sub Button15_Click(sender As Object, e As EventArgs) Handles Button15.Click轻松读卡技术支持:网站:Dim i, j As IntegerDim cardidhex, …...

编程新知 2026/2/7 17:44:40

LeetCode - 394. 字符串解码

题目 394. 字符串解码 - 力扣（LeetCode） 思路使用两个栈：一个存储重复次数，一个存储字符串遍历输入字符串： 数字处理：遇到数字时，累积计算重复次数左括号处理：保存当前状态&a…...

编程新知 2026/1/25 10:09:59

服务器硬防的应用场景都有哪些？

服务器硬防是指一种通过硬件设备层面的安全措施来防御服务器系统受到网络攻击的方式，避免服务器受到各种恶意攻击和网络威胁，那么，服务器硬防通常都会应用在哪些场景当中呢？ 硬防服务器中一般会配备入侵检测系统和预防系统&#x…...

编程新知 2025/11/9 19:17:07

基于Docker Compose部署Java微服务项目

一. 创建根项目根项目（父项目）主要用于依赖管理一些需要注意的点： 打包方式需要为 pom<modules>里需要注册子模块不要引入maven的打包插件，否则打包时会出问题 <?xml version"1.0" encoding"UTF-8…...

编程新知 2026/2/5 3:09:56

PL0语法，分析器实现！

简介 PL/0 是一种简单的编程语言，通常用于教学编译原理。它的语法结构清晰，功能包括常量定义、变量声明、过程（子程序）定义以及基本的控制结构（如条件语句和循环语句）。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言，由 Niklaus Wirth 设计，用于展示编译原理的核…...

编程新知 2026/1/29 17:06:33

成都鼎讯硬核科技！雷达目标与干扰模拟器，以卓越性能制胜电磁频谱战

在现代战争中，电磁频谱已成为继陆、海、空、天之后的 “第五维战场”，雷达作为电磁频谱领域的关键装备，其干扰与抗干扰能力的较量，直接影响着战争的胜负走向。由成都鼎讯科技匠心打造的雷达目标与干扰模拟器，凭借数字射…...

编程新知 2026/2/1 7:18:47

零基础在实践中学习网络安全-皮卡丘靶场（第九期-Unsafe Fileupload模块）（yakit方式）

本期内容并不是很难，相信大家会学的很愉快，当然对于有后端基础的朋友来说，本期内容更加容易了解，当然没有基础的也别担心，本期内容会详细解释有关内容本期用到的软件：yakit（因为经过之前好多期…...

编程新知 2026/1/21 12:29:04

零实现

简介实现

相关文章：