当前位置：首页 > news >正文

8-pytorch-损失函数与反向传播

news 2026/2/8 7:28:37

b站小土堆pytorch教程学习笔记

根据loss更新模型参数
1.计算实际输出与目标之间的差距
2.为我们更新输出提供一定的依据（反向传播）

在这里插入图片描述

1 MSEloss

import torch
from torch.nn import L1Loss
from torch import nninputs=torch.tensor([1,2,3],dtype=torch.float32)
targets=torch.tensor([1,2,5],dtype=torch.float32)inputs=torch.reshape(inputs,(-1,1,1,3))
targets=torch.reshape(targets,(-1,1,1,3))loss=L1Loss()
result=loss(inputs,targets)loss_mse=nn.MSELoss()
result_mse=loss_mse(inputs,targets)print(result)
print(result_mse)

tensor(0.6667)
tensor(1.3333)

2 Cross EntropyLoss

在这里插入图片描述

x=torch.tensor([0.1,0.2,0.3])#需要reshape为要求的(batch_size,class)
y=torch.tensor([1])#target已经为要求的batch_size无需reshape
x=torch.reshape(x,(-1,3))
loss_cross=nn.CrossEntropyLoss()
result_cross=loss_cross(x,y)
print(result_cross)

tensor(1.1019)

3 在具体的神经网络中使用loss

import torch
import torchvision.datasets
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriterdataset=torchvision.datasets.CIFAR10('dataset',train=False,transform=torchvision.transforms.ToTensor(),download=True)
dataloader=DataLoader(dataset,batch_size=1)class Han(nn.Module):def __init__(self):super(Han, self).__init__()self.model1=Sequential(Conv2d(3,32,5,padding=2),MaxPool2d(2),Conv2d(32,32,5,padding=2),MaxPool2d(2),Conv2d(32,64,5,padding=2),MaxPool2d(2),Flatten(),Linear(1024,64),Linear(64,10))def forward(self,x):x=self.model1(x)return xloss=nn.CrossEntropyLoss()
han=Han()
for data in dataloader:imgs,target=dataoutput=han(imgs)# print(target)# print(output)result_loss=loss(output,target)print(result_loss)

*tensor([7])
tensor([[ 0.0057, -0.0201, -0.0796, 0.0556, -0.0625, 0.0125, -0.0413, -0.0056,
0.0624, -0.1072]], grad_fn=)…

tensor(2.2664, grad_fn=)…

4 反向传播优化器

定义优化器
将待更新的每个参数梯度清零
调用损失函数的反向传播函数求出每个节点的梯度
使用step函数对模型的每个参数调优

import torch
import torchvision.datasets
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriterdataset=torchvision.datasets.CIFAR10('dataset',train=False,transform=torchvision.transforms.ToTensor(),download=True)
dataloader=DataLoader(dataset,batch_size=64)class Han(nn.Module):def __init__(self):super(Han, self).__init__()self.model1=Sequential(Conv2d(3,32,5,padding=2),MaxPool2d(2),Conv2d(32,32,5,padding=2),MaxPool2d(2),Conv2d(32,64,5,padding=2),MaxPool2d(2),Flatten(),Linear(1024,64),Linear(64,10))def forward(self,x):x=self.model1(x)return xloss=nn.CrossEntropyLoss()
han=Han()
optim=torch.optim.SGD(han.parameters(),lr=0.01)for epoch in range(5):running_loss=0.0#一个epoch结束的loss和for data in dataloader:imgs,target=dataoutput=han(imgs)result_loss=loss(output,target)#每次迭代的lossoptim.zero_grad()#将网络中每个可调节参数对应的梯度调为0result_loss.backward()#优化器需要每个参数的梯度，使用反向传播获得optim.step()#对每个参数调优running_loss=running_loss+result_lossprint(running_loss)

Files already downloaded and verified
tensor(361.0316, grad_fn=)
tensor(357.6938, grad_fn=)
tensor(343.0560, grad_fn=)
tensor(321.8132, grad_fn=)
tensor(313.3173, grad_fn=)

8-pytorch-损失函数与反向传播

b站小土堆pytorch教程学习笔记根据loss更新模型参数 1.计算实际输出与目标之间的差距 2.为我们更新输出提供一定的依据（反向传播） 1 MSEloss import torch from torch.nn import L1Loss from torch import nninputstorch.tensor([1,2,3],dtypetorch.fl…...

编程日记 2024/2/25 21:36:31

MySQL高级特性篇(8)-数据库连接池的配置与优化

MySQL数据库连接池的配置与优化 MySQL数据库是当前最流行的关系型数据库管理系统之一，高效的数据库连接池配置与优化是提高数据库性能和并发性能的重要手段。本文将介绍MySQL数据库连接池的配置与优化，并提供详细示例。 1. 连接池的作用与优势数据库…...

编程日记 2024/2/25 21:35:29

mac下使用jadx反编译工具

直接执行步骤： 1.创建 jadx目录 mkdir jadx2.将存储库克隆到目录 git clone https://github.com/skylot/jadx.git 3. 进入 jadx目录 cd jadx 4.执行编译等待片刻 ./gradlew dist出现这个就代表安装好了。 5.最后找到 jadx-gui 可执行文件，双击两下…...

编程日记 2024/2/25 21:34:28

分布式一致性软件-zookeeper

在我们进行软件开发过程中，为了实现某个功能可能借助多个软件，如存储数据的数据库软件：MySQL，Redis；消息中间件：rocketMq，kafka等。那么在分布式系统中，如果想实现数据一致性&#x…...

编程日记 2024/2/25 21:28:24

企业计算机服务器中了babyk勒索病毒怎么办？Babyk勒索病毒解密数据恢复

随着网络技术的应用与普及，越来越多的企业采用了数字化办公模式，数字化办公模式可以为企业提供强有力的数据支撑，可以为企业的发展方向与产品业务调整做好基础工作。但网络是一把双刃剑，在为企业提供便利的同时，也为企…...

编程日记 2024/2/25 21:27:23

板块一 Servlet编程：第五节 Cookie对象全解来自【汤米尼克的JAVAEE全套教程专栏】

板块一 Servlet编程：第五节 Cookie对象全解一、什么是CookieCookie的源码二、Cookie的具体操作（1）创建Cookie（2）获取Cookie（3）设置Cookie的到期时间（4）设置Cookie的路径…...

编程日记 2024/2/25 21:26:22

自动驾驶---Motion Planning之Path Boundary

1 背景在上文《自动驾驶---Motion Planning之LaneChange》中，笔者提到过两种LaneChange的思路，这里再简单回顾一下：（1）利用Routing和周围环境的信息，决定是否进行换道的决策；（2）采用的博弈思想（蒙特卡洛树搜索---MCTS）决定是否进行换道的决策。不管是变道，避让还是…...

编程日记 2024/2/25 21:25:21

Leetcode 3048. Earliest Second to Mark Indices I

Leetcode 3048. Earliest Second to Mark Indices I 1. 解题思路2. 代码实现题目链接：3048. Earliest Second to Mark Indices I 1. 解题思路这一题的话基础的思路就是二分法查找最小的可以将所有的数字都mark上的最小位置。因此，这里的问题就会变…...

编程日记 2024/2/25 21:24:20

从源码学习单例模式

单例模式单例模式是一种设计模式，常用于确保一个类只有一个实例，并提供一个全局访问点。这意味着无论在程序的哪个地方，只能创建一个该类的实例，而不会出现多个相同实例的情况。在单例模式中，常用的实现方式包括懒汉…...

编程日记 2024/2/25 21:23:19

axios介绍和使用

1. Axios是什么 Axios框架全称（ajax – I/O – system） Axios是一个基于Promise的JavaScript HTTP客户端，用于浏览器和Node.js环境。它可以发送HTTP请求并支持诸如请求和响应拦截、转换数据、取消请求以及自动转换JSON数据等功能。 Axios提…...

编程日记 2024/2/25 21:22:18

redis雪崩问题

Redis雪崩问题是指在Redis缓存系统中，由于某些原因导致大量缓存数据同时失效或过期，导致所有请求都直接访问数据库，从而引发数据库性能问题甚至宕机的情况。造成Redis雪崩问题的原因主要有以下几个： 缓存数据同时失效&#xff…...

编程日记 2024/2/25 21:21:17

[SUCTF 2019]EasySQL1 题目分析与详解

一、题目介绍 1、题目来源： BUUCTF网站，网址：https://buuoj.cn/challenges 2、题目描述： 通过以上信息，拿到flag。二、解题思路首先打开靶机，尝试输入1查看回显，回显如图所示：…...

编程日记 2024/2/25 21:17:12

TestNG与ExtentReport集成目录 1 通过实现ITestListener的方法添加Reporter log 1.1 MyTestListener设置 1.2 输出结果 2 TestNG与ExtentReporter集成 2.1 项目结构 2.2 MyExtentReportListener设置 2.3 单多Suite、Test组合测试 2.3.1 单Suite单Test 2.3…...

编程日记 2024/2/25 21:15:11

【JavaEE】_form表单构造HTTP请求

目录 1. form表单的格式 1.1 form表单的常用属性 1.2 form表单的常用搭配标签：input 2. form表单构造GET请求实例 3. form表单构造POST请求实例 4. form表单构造法的缺陷对于客户端浏览器，以下操作即构造了HTTP请求： 1. 直接在浏览器…...

编程日记 2024/2/25 21:13:09

Mysql中INFORMATION_SCHEMA虚拟库使用

虚拟库字段讲解 #查看INFORMATION_SCHEMA的表信息 DESC information_schema.tables; 重要列： TABLE_SCHEMA #表所在的库 TABLE_NAME #表名 ENGINE #表的存储引擎 TABLE_ROWS #表的行数 DATA_LENGTH #表数据行占用的字节数 AVG_ROW_LENGTH #平均行长度 INDEX_LENGTH…...

编程日记 2024/2/25 21:06:02

【《高性能 MySQL》摘录】第 2 章 MySQL 基准测试

文章目录 2.1 为什么需要基准测试2.2 基准测试的策略2.2.1　测试何种指标 2.3 基准测试方法2.3.1　设计和规划基准测试2.3.2　基准测试应该运行多长时间2.3.3　获取系统性能和状态2.3.4　获得准确的测试结果2.3.5　运行基准测试并分析结果2.3.6　绘图的重要性 2.4　基准测试工具…...

编程日记 2024/2/25 21:01:58

常用的Web应用程序的自动测试工具有哪些

在Web应用程序的自动化测试领域，有许多流行的工具可供选择。以下是一些常用的Web自动化测试工具： 1. Selenium - Selenium是最流行的开源Web应用程序自动化测试套件之一。 - 它支持多种编程语言，如Java、C#、Python、Ruby等。 …...

编程日记 2024/2/25 20:54:51

人工智能与开源机器学习框架

链接：华为机考原题 TensorFlow是一个开源的机器学习框架，由Google开发和维护。它提供了一个针对神经网络和深度学习的强大工具集，能够帮助开发人员构建和训练各种机器学习模型。 TensorFlow的基本概念包括： 张量（Ten…...

编程日记 2024/2/25 20:52:49

高通XBL阶段读取分区

【需求】： 在某些场景下，需要在XBL阶段读取分区数据，需要验证xbl阶段方案这里主要以裸分区为例，比如oem分区。 1、创建一个1MB大小的oem.img，写入内容“test oem partition” 创建方式： dd if/dev/null …...

编程日记 2024/2/25 20:51:48

[极客大挑战2019]upload

该题考点：后缀黑名单文件内容过滤php木马的几种书写方法 phtml可以解析php代码；<script language"php">eval($_POST[cmd]);</script> 犯蠢的点儿：利用html、php空格和php.不解析<script language"php"&…...

编程日记 2024/2/25 20:48:45

进程地址空间（比特课总结）

一、进程地址空间 1. 环境变量 1 ）⽤户级环境变量与系统级环境变量全局属性：环境变量具有全局属性，会被⼦进程继承。例如当bash启动⼦进程时，环境变量会⾃动传递给⼦进程。本地变量限制：本地变量只在当前进程(ba…...

编程新知 2025/11/15 6:48:52

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

蛋白质结合剂（如抗体、抑制肽）在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上，高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术，但这类方法普遍面临资源消耗巨大、研发周期冗长…...

编程新知 2026/1/25 13:18:12

SCAU期末笔记 - 数据分析与数据挖掘题库解析

这门怎么题库答案不全啊日来简单学一下子来一、选择题（可多选） 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B.分类和预测 C.数据预处理 D.数据流挖掘 A. 频繁模式挖掘：专注于发现数据中…...

编程新知 2026/1/24 14:15:43

【解密LSTM、GRU如何解决传统RNN梯度消失问题】

解密LSTM与GRU：如何让RNN变得更聪明？ 在深度学习的世界里，循环神经网络（RNN）以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而，传统RNN存在的一个严重问题——梯度消失&#…...

编程新知 2025/12/24 1:45:14

蓝牙 BLE 扫描面试题大全(2)：进阶面试题与实战演练

前文覆盖了 BLE 扫描的基础概念与经典问题蓝牙 BLE 扫描面试题大全(1)：从基础到实战的深度解析-CSDN博客，但实际面试中，企业更关注候选人对复杂场景的应对能力（如多设备并发扫描、低功耗与高发现率的平衡）和前沿技术的…...

编程新知 2026/2/5 3:41:42

spring：实例工厂方法获取bean

spring处理使用静态工厂方法获取bean实例，也可以通过实例工厂方法获取bean实例。实例工厂方法步骤如下： 定义实例工厂类（Java代码），定义实例工厂（xml），定义调用实例工厂&#xff…...

编程新知 2025/11/25 22:46:30

【RockeMQ】第2节｜RocketMQ快速实战以及核⼼概念详解（二）

升级Dledger高可用集群一、主从架构的不足与Dledger的定位主从架构缺陷数据备份依赖Slave节点，但无自动故障转移能力，Master宕机后需人工切换，期间消息可能无法读取。Slave仅存储数据，无法主动升级为Master响应请求&#xff…...

编程新知 2025/9/2 3:37:40

Python 实现 Web 静态服务器（HTTP 协议）

目录一、在本地启动 HTTP 服务器1. Windows 下安装 node.js1）下载安装包2）配置环境变量3）安装镜像4）node.js 的常用命令 2. 安装 http-server 服务3. 使用 http-server 开启服务1）使用 http-server2）详解 …...

编程新知 2026/1/29 2:11:49

MySQL：分区的基本使用

目录一、什么是分区二、有什么作用三、分类四、创建分区五、删除分区一、什么是分区 MySQL 分区（Partitioning）是一种将单张表的数据逻辑上拆分成多个物理部分的技术。这些物理部分（分区）可以独立存储、管理和优化，…...

编程新知 2026/2/2 18:52:32

springboot 日志类切面，接口成功记录日志，失败不记录

springboot 日志类切面，接口成功记录日志，失败不记录自定义一个注解方法 import java.lang.annotation.ElementType; import java.lang.annotation.Retention; import java.lang.annotation.RetentionPolicy; import java.lang.annotation.Target;/***…...

编程新知 2026/2/1 13:59:09

8-pytorch-损失函数与反向传播

1 MSEloss

2 Cross EntropyLoss

3 在具体的神经网络中使用loss

4 反向传播优化器

相关文章：

8-pytorch-损失函数与反向传播

MySQL高级特性篇(8)-数据库连接池的配置与优化

mac下使用jadx反编译工具

分布式一致性软件-zookeeper

企业计算机服务器中了babyk勒索病毒怎么办？Babyk勒索病毒解密数据恢复

板块一 Servlet编程：第五节 Cookie对象全解来自【汤米尼克的JAVAEE全套教程专栏】

自动驾驶---Motion Planning之Path Boundary

Leetcode 3048. Earliest Second to Mark Indices I

从源码学习单例模式

axios介绍和使用

redis雪崩问题

[SUCTF 2019]EasySQL1 题目分析与详解

TestNG与ExtentReport单元测试导出报告文档

【JavaEE】_form表单构造HTTP请求

Mysql中INFORMATION_SCHEMA虚拟库使用

【《高性能 MySQL》摘录】第 2 章 MySQL 基准测试

常用的Web应用程序的自动测试工具有哪些

人工智能与开源机器学习框架

高通XBL阶段读取分区

[极客大挑战2019]upload

进程地址空间（比特课总结）

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

SCAU期末笔记 - 数据分析与数据挖掘题库解析

【解密LSTM、GRU如何解决传统RNN梯度消失问题】

蓝牙 BLE 扫描面试题大全(2)：进阶面试题与实战演练

spring：实例工厂方法获取bean

【RockeMQ】第2节｜RocketMQ快速实战以及核⼼概念详解（二）

Python 实现 Web 静态服务器（HTTP 协议）

MySQL：分区的基本使用

springboot 日志类切面，接口成功记录日志，失败不记录

1 MSEloss

2 Cross EntropyLoss

3 在具体的神经网络中使用loss

4 反向传播 优化器

相关文章：

4 反向传播优化器