当前位置：首页 > news >正文

PyTorch学习笔记：nn.MSELoss——MSE损失

news 2026/2/7 21:52:06

PyTorch学习笔记：nn.MSELoss——MSE损失

torch.nn.MSELoss(size_average = None，reduce = None，reduction = 'mean')

功能：创建一个平方误差(MSE)损失函数，又称为L2损失：
$l(x,y)=L={l1,…,lN}T,ln=(xn−yn)2l(x,y)=L=\{l_1,\dots,l_N\}^T,l_n=(x_n-y_n)^2$
其中， $N$ 表示batch size。

函数图像：

在这里插入图片描述

输入：

size_average与reduce已经被弃用，具体功能可由reduction替代
reduction：指定损失输出的形式，有三种选择：none|mean|sum。none：损失不做任何处理，直接输出一个数组；mean：将得到的损失求平均值再输出，会输出一个数；sum：将得到的损失求和再输出，会输出一个数

注意：

输入的 $x$ 与 $y$ 可以是任意维数的数组，但是二者形状必须一致

代码案例

对比reduction不同时，输出损失的差异

import torch.nn as nn
import torchx = torch.rand(10, dtype=torch.float)
y = torch.rand(10, dtype=torch.float)
mse_none = nn.MSELoss(reduction='none')
mse_mean = nn.MSELoss(reduction='mean')
mse_sum = nn.MSELoss(reduction='sum')
out_none = mse_none(x, y)
out_mean = mse_mean(x, y)
out_sum = mse_sum(x, y)
print(x)
print(y)
print(out_none)
print(out_mean)
print(out_sum)

输出

# 用于输入的x
tensor([0.4138, 0.1747, 0.9259, 0.2938, 0.5557, 0.9708, 0.0649, 0.6155, 0.3192, 0.1918])
# 用于输入的y
tensor([0.1024, 0.9160, 0.8386, 0.0783, 0.1479, 0.9933, 0.8791, 0.4219, 0.7586, 0.2212])
# 当reduction设置为none时，输出一个数组
# 该数组上的元素为x，y对应每个元素的平方误差损失，即对应元素做差求平方
tensor([9.6983e-02, 5.4955e-01, 7.6214e-03, 4.6433e-02, 1.6630e-01, 5.0293e-04, 6.6287e-01, 3.7512e-02, 1.9310e-01, 8.6344e-04])
# 当reduction设置为mean时，输出所有损失的平均值
tensor(0.1762)
# 当reduction设置为sum时，输出所有损失的和
tensor(1.7617)

注：绘图程序

import torch.nn as nn
import torch
import numpy as np
import matplotlib.pyplot as pltloss = nn.MSELoss(reduction='none')
x = torch.tensor([0]*100)
y = torch.from_numpy(np.linspace(-3,3,100))
loss_value = loss(x,y)
plt.plot(y, loss_value)
plt.savefig('MSELoss.jpg')

官方文档

nn.MSELoss：https://pytorch.org/docs/stable/generated/torch.nn.MSELoss.html#torch.nn.MSELoss

初步完稿于：2022年1月29日

PyTorch学习笔记：nn.MSELoss——MSE损失

PyTorch学习笔记：nn.MSELoss——MSE损失 torch.nn.MSELoss(size_average None，reduce None，reduction mean)功能：创建一个平方误差(MSE)损失函数，又称为L2损失： l(x,y)L{l1,…,lN}T,ln(xn−yn)2l(x,y)L…...

编程日记 2023/2/11 19:23:14

apache和nginx的TLS1.0和TLS1.1禁用处理方案

1、TLS1.0和TLS1.1是什么？ TLS协议其实就是网络安全传输层协议，用于在两个通信应用程序之间提供保密性和数据完整性，TLS 1. 0 和TLS 1. 1 是分别是96 年和 06 年发布的老版协议。 2、为什么要禁用TLS1.0和TLS1.1传输协议 TLS1.0和TLS1.1协…...

编程日记 2023/2/11 19:22:04

K_A12_002 基于STM32等单片机采集光敏电阻传感器参数串口与OLED0.96双显示

K_A12_002 基于STM32等单片机采集光敏电阻传感器参数串口与OLED0.96双显示一、资源说明二、基本参数参数引脚说明三、驱动说明IIC地址/采集通道选择/时序对应程序:四、部分代码说明1、接线引脚定义1.1、STC89C52RC光敏电阻传感器模块1.2、STM32F103C8T6光敏电阻传感器模块五、基…...

编程日记 2023/2/11 19:20:55

《机器学习》学习笔记

第 2 章模型评估与选择 2.1 经验误差与过拟合精度：精度1-错误率。如果在 mmm 个样本中有 aaa 个样本分类错误，则错误率 Ea/mEa/mEa/m，精度 1−a/m1-a/m1−a/m。误差：一般我们把学习器的实际预测输出与样本的真实输出之间的差…...

编程日记 2023/2/11 19:19:44

前端卷算法系列（一）

前端卷算法系列（一） 两数之和给定一个整数数组 nums 和一个整数目标值 target，请你在该数组中找出和为目标值 target 的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是，数组中同…...

编程日记 2023/2/11 19:18:38

【机器学习】聚类算法（理论）

聚类算法（理论） 目录一、概论1、聚类算法的分类2、欧氏空间的引入二、K-Means算法1、算法思路2、算法总结三、DBSCAN算法1、相关概念2、算法思路3、算法总结四、实战部分一、概论聚类分析，即聚类（Clustering）&#xf…...

编程日记 2023/2/11 19:17:31

Docker-用Jenkins发版Java项目-（1）Docke安装Jenkins

文章目录前言环境背景操作流程docker安装及jenkins软件安装jenkins配置登录配置安装插件及创建账号前言学海无涯，旅“途”漫漫，“途”中小记，如有错误，敬请指出，在此拜谢！ 最近新购得了M2的MAC&#xff0c…...

编程日记 2023/2/11 19:16:26

java集合框架内容整理

主要内容集合框架体系ArrayListLinkedListHashSetTreeSetLinkedHashSet内部比较器和外部比较器哈希表的原理List集合List集合的主要实现类有ArrayList和LinkedList，分别是数据结构中顺序表和链表的实现。另外还包括栈和队列的实现类：Deque和Queue。• Li…...

编程日记 2023/2/11 19:15:20

win10系统安装Nginx

Nginx是一款自由的、开源的、高性能的HTTP服务器和反向代理服务器，同时也提供了IMAP/POP3/SMTP服务。 Nginx可以进行反向代理、负载均衡、HTTP服务器（动静分离）、正向代理等操作。因为最近在公司使用到了Nginx 第一步：下载Nginx …...

编程日记 2023/2/11 19:14:13

数据库学习笔记（2）——workbench和SQL语言

1、workbench简介： 登录客户端的两种方法在cmd中，只能通过sql语句控制数据库；workbench其实就是一种图形化数据库管理工具，在workbench中既可以通过sql语句控制数据库，也可以通过图形化界面控制数据库。通过workbenc…...

编程日记 2023/2/11 19:13:05

测量学期末考试之名词解释总结

仅供自己参考，且范围不全面.大地水准面与处于静止平衡状态的平均海水面重合，并延伸通过陆地的水准面高程地面点到大地水准面的铅锤距离水准面处于静止状态的水面就是水准面高差两点的水准面之间的铅锤距离垂直角在铅锤面上，瞄准目标的倾斜视线…...

编程日记 2023/2/11 19:11:58

TDengine时序数据库的简单使用

最近学习了TDengine数据库，因为我们公司有硬件设备，设备按照每分钟，每十分钟，每小时上传数据，存入数据库。而这些数据会经过sql查询，统计返回展示到前端。但时间积累后现在数据达到了百万级数据&#xff0c…...

编程日记 2023/2/11 19:10:51

记录每日LeetCode 2335.装满被子需要的最短总时长 Java实现

题目描述： 现有一台饮水机，可以制备冷水、温水和热水。每秒钟，可以装满 2 杯不同类型的水或者 1 杯任意类型的水。给你一个下标从 0 开始、长度为 3 的整数数组 amount ，其中 amount[0]、amount[1] 和 amount[2] 分别表示需要…...

编程日记 2023/2/11 19:09:43

了解线程池newFixedTheadPool

什么是线程池操作系统能够进行运算调度的最小单位。线程池是一种多线程处理形式。为什么引入线程池的概念解决处理短时间任务时创建和销毁线程代价较大的弊端，可以使用线程池技术。复用饭店只有一个服务员和饭店有10个服务员线程池的种类 newFixedThea…...

编程日记 2023/2/11 19:08:38

IP分片和TCP分段解析--之IP分片

本文目录什么是IP分片为什么会产生IP分片为什么要避免IP分片如何避免IP分片什么是IP分片 IP协议栈将TCP/UDP传输层要求它发送的，但长度大于发送端口MTU的一个数据包，分割成多个IP报文后分多次发送。这些分成多次发送的多个IP报文就是IP分片。为什么会…...

编程日记 2023/2/11 19:07:32

物联网方向常见通信方式有哪些？

常用的有线通信方式有串口、以太网等。 1、串口串口通信普及率高、成本低，但是组网能力差，只适合低速率和小数据量的通信 2、以太网接口（网线）以太网（Ethernet）是目前最普遍的一种局域网通信技术，它规定了包括物理层的连线、电子信号和介质访问层协议的内容。以太…...

编程日记 2023/2/11 19:06:24

windows wireshark抓到未加入组的组播消息

现象在Windows上开启wireshark，抓到了大量地址为239.255.255.251的组播包。同时，根据组播相关命令，调用netsh interface ipv4 show joins，显示当前并没加入 239.255.255.251 组播组。解决根据IGMP Snooping，I…...

编程日记 2023/2/11 19:05:16

【PTA Advanced】1156 Sexy Primes（C++）

目录题目 Input Specification: Output Specification: Sample Input 1: Sample Output 1: Sample Input 2: Sample Output 2: 思路代码题目 Sexy primes are pairs of primes of the form (p, p6), so-named since "sex" is the Latin word for "…...

编程日记 2023/2/11 19:04:09

项目（今日指数）

一项目架构1.1 今日指数技术选型【1】前端技术【2】后端技术栈【3】整体概览3.2 核心业务介绍1】业务结构预览【2】业务功能简介1.定时任务调度服务XXL-JOB通过RestTemplate多线程动态拉去股票接口数据，刷入数据库； 2.国内指数服务 3.板块指数服务 4.涨…...

编程日记 2023/2/11 19:03:03

适配器模式（Adapter Pattern）

1.什么是适配器模式？ 适配器模式（Adapter Pattern）是作为两个不兼容的接口之间的桥梁。这种类型的设计模式属于结构型模式，它结合了两个独立接口的功能。这种模式涉及到一个单一的类，该类负责加入独立的或不兼容的接…...

编程日记 2023/2/11 19:01:56

Appium+python自动化（十六）- ADB命令

简介 Android 调试桥(adb)是多种用途的工具，该工具可以帮助你你管理设备或模拟器的状态。 adb ( Android Debug Bridge)是一个通用命令行工具，其允许您与模拟器实例或连接的 Android 设备进行通信。它可为各种设备操作提供便利，如安装和调试…...

编程新知 2026/1/21 18:20:51

.Net框架，除了EF还有很多很多......

文章目录 1. 引言2. Dapper2.1 概述与设计原理2.2 核心功能与代码示例基本查询多映射查询存储过程调用 2.3 性能优化原理2.4 适用场景 3. NHibernate3.1 概述与架构设计3.2 映射配置示例Fluent映射XML映射 3.3 查询示例HQL查询Criteria APILINQ提供程序 3.4 高级特性3.5 适用场…...

编程新知 2026/2/1 19:26:16

STM32+rt-thread判断是否联网

一、根据NETDEV_FLAG_INTERNET_UP位判断 static bool is_conncected(void) {struct netdev *dev RT_NULL;dev netdev_get_first_by_flags(NETDEV_FLAG_INTERNET_UP);if (dev RT_NULL){printf("wait netdev internet up...");return false;}else{printf("loc…...

编程新知 2025/9/23 20:06:08

（二）TensorRT-LLM | 模型导出（v0.20.0rc3）

0. 概述上一节对安装和使用有个基本介绍。根据这个 issue 的描述，后续 TensorRT-LLM 团队可能更专注于更新和维护 pytorch backend。但 tensorrt backend 作为先前一直开发的工作，其中包含了大量可以学习的地方。本文主要看看它导出模型的部分&#x…...

编程新知 2026/1/24 6:44:11

大模型多显卡多服务器并行计算方法与实践指南

一、分布式训练概述大规模语言模型的训练通常需要分布式计算技术，以解决单机资源不足的问题。分布式训练主要分为两种模式：数据并行：将数据分片到不同设备，每个设备拥有完整的模型副本模型并行：将模型分割到不同设备，每个设备处理部分模型计算现代大模型训练通常结合…...

编程新知 2025/12/10 20:45:02

Spring AI 入门：Java 开发者的生成式 AI 实践之路

一、Spring AI 简介在人工智能技术快速迭代的今天，Spring AI 作为 Spring 生态系统的新生力量，正在成为 Java 开发者拥抱生成式 AI 的最佳选择。该框架通过模块化设计实现了与主流 AI 服务（如 OpenAI、Anthropic）的无缝对接&…...

编程新知 2025/12/25 18:03:56

06 Deep learning神经网络编程基础激活函数 --吴恩达

深度学习激活函数详解一、核心作用引入非线性：使神经网络可学习复杂模式控制输出范围：如Sigmoid将输出限制在(0,1)梯度传递：影响反向传播的稳定性二、常见类型及数学表达 Sigmoid σ ( x ) = 1 1 +...

编程新知 2025/11/17 21:48:26

分布式增量爬虫实现方案

之前我们在讨论的是分布式爬虫如何实现增量爬取。增量爬虫的目标是只爬取新产生或发生变化的页面，避免重复抓取，以节省资源和时间。在分布式环境下，增量爬虫的实现需要考虑多个爬虫节点之间的协调和去重。另一种思路：将增量判…...

编程新知 2026/2/6 1:18:56

JVM 内存结构详解

内存结构运行时数据区： Java虚拟机在运行Java程序过程中管理的内存区域。程序计数器： 线程私有，程序控制流的指示器，分支、循环、跳转、异常处理、线程恢复等基础功能都依赖这个计数器完成。每个线程都有一个程序计数…...

编程新知 2026/2/6 3:24:58

Kafka入门-生产者

生产者生产者发送流程： 延迟时间为0ms时，也就意味着每当有数据就会直接发送异步发送API 异步发送和同步发送的不同在于：异步发送不需要等待结果，同步发送必须等待结果才能进行下一步发送。普通异步发送首先导入所需的k…...

编程新知 2026/1/26 4:49:33

PyTorch学习笔记：nn.MSELoss——MSE损失

代码案例

官方文档

相关文章：