当前位置：首页 > news >正文

YOLOv11改进策略【损失函数篇】| Slide Loss，解决简单样本和困难样本之间的不平衡问题

news 2026/2/8 1:19:54

一、本文介绍

本文记录的是改进YOLOv11的损失函数，将其替换成Slide Loss，并详细说明了优化原因，注意事项等。Slide Loss函数可以有效地解决样本不平衡问题，为困难样本赋予更高的权重，使模型在训练过程中更加关注困难样本。若是在自己的数据集中发现容易样本的数量非常大，而困难样本相对稀疏，可尝试使用Slide Loss来提高模型在处理复杂样本时的性能。

文章目录

一、本文介绍
二、Slide Loss原理
- 2.1 IoU含义
- 2.2 原理
- 2.2 优势
三、Slide Loss的实现代码
四、添加步骤
- 4.1 修改ultralytics/utils/loss.py
- 4.2 Slide Loss的调用

二、Slide Loss原理

2.1 IoU含义

IoU(P, G) = area(P∩G) / area(G)，其中P是预测框，G是真实框（ground truth）。IoU的值在[0, 1]之间。

IoU是预测框与真实框的交集面积与并集面积之比。它用于衡量预测框与真实框的重合程度。

2.2 原理

样本分类依据：
- Slide Loss函数基于预测框和真实框的IoU大小来区分容易样本和困难样本。
- 为了减少超参数，将所有边界框的IoU值的平均值作为阈值µ，小于µ的被视为负样本，大于µ的为正样本。
强调边界样本：
- 但处于边界附近的样本由于分类不明确，往往会遭受较大损失。为了解决这个问题，希望模型能够学习优化这些样本，并更充分地利用这些样本训练网络。
- 首先将样本通过参数µ分为正样本和负样本，然后通过一个加权函数Slide来强调处于边界的样本。
- Slide加权函数表达式为：
  $\begin{cases} 1&x\leq\mu - 0.1\\ e^{1-\mu}&\mu < x <\mu - 0.1\\ e^{1 - x}&x\geq u \end{cases}$

在这里插入图片描述

2.2 优势

解决样本不平衡问题：
- 在大多数情况下，容易样本的数量非常大，而困难样本相对稀疏，Slide Loss函数可以有效地解决样本不平衡问题，使模型在训练过程中更加关注困难样本。
自适应学习阈值：
- 通过自动计算所有边界框的IoU值的平均值作为阈值µ，减少了人为设置超参数的难度，提高了模型的适应性。
提高模型性能：
- 根据论文实验结果，Slide函数在中等难度和困难子集上提高了模型的性能，使模型能够更好地学习困难样本的特征，提高了模型的泛化能力。

论文：https://arxiv.org/pdf/2208.02019
源码：https://github.com/Krasjet-Yu/YOLO-FaceV2/blob/d9c8f24d5dba392ef9d6b350a7c50b850051b32b/utils/loss.py#L16

三、Slide Loss的实现代码

Slide Loss的实现代码如下：

import math
class SlideLoss(nn.Module):def __init__(self, loss_fcn):super(SlideLoss, self).__init__()self.loss_fcn = loss_fcnself.reduction = loss_fcn.reductionself.loss_fcn.reduction = 'none'  # required to apply SL to each elementdef forward(self, pred, true, auto_iou=0.5):loss = self.loss_fcn(pred, true)if auto_iou < 0.2:auto_iou = 0.2b1 = true <= auto_iou - 0.1a1 = 1.0b2 = (true > (auto_iou - 0.1)) & (true < auto_iou)a2 = math.exp(1.0 - auto_iou)b3 = true >= auto_ioua3 = torch.exp(-(true - 1.0))modulating_weight = a1 * b1 + a2 * b2 + a3 * b3loss *= modulating_weightif self.reduction == 'mean':return loss.mean()elif self.reduction == 'sum':return loss.sum()else:  # 'none'return loss

四、添加步骤

4.1 修改ultralytics/utils/loss.py

此处需要修改的文件是ultralytics/utils/loss.py

loss.py中定义了模型的损失函数和计算方法，我们想要加入新的损失函数就只需要将代码放到这个文件内即可。

Slide Loss添加后如下：

在这里插入图片描述

4.2 Slide Loss的调用

在loss.py中的v8DetectionLoss函数中添加如下代码，使模型调用此Slide Loss函数。

self.bce = SlideLoss(nn.BCEWithLogitsLoss(reduction="none"))

在这里插入图片描述

此时再次训练模型便会使用Slide Loss计算模型的损失函数。

YOLOv11改进策略【损失函数篇】| Slide Loss，解决简单样本和困难样本之间的不平衡问题

一、本文介绍本文记录的是改进YOLOv11的损失函数，将其替换成Slide Loss，并详细说明了优化原因，注意事项等。Slide Loss函数可以有效地解决样本不平衡问题，为困难样本赋予更高的权重，使模型在训练过程中更加关注困难样…...

编程日记 2024/9/30 22:06:48

动静态库（Linux）

文章目录前言一、静态库二、动态库三、深入理解动态库总结前言我们之前用过c语言的库.Linux中默认的都是使用动态库，如果想要使用静态库，就必须加上-static选项。默认都是安装的动态库，系统中一般没有静态库，如果要使用&#…...

编程日记 2024/9/30 22:05:46

51单片机和ARM单片机的区别

在嵌入式系统设计与应用中，单片机作为核心控制单元，扮演着至关重要的角色。其中，51单片机和ARM单片机作为两种常见的单片机类型，各自具有独特的特点和优势。本文将从多个维度深入探讨这两种单片机的区别，以便读者更好地…...

编程日记 2024/9/30 22:03:44

[Day 81] 區塊鏈與人工智能的聯動應用：理論、技術與實踐

區塊鏈在食品安全中的應用前言食品安全一直是全球關注的問題，隨著全球供應鏈的複雜性增加，追踪食品從生產到消費的過程變得愈發困難。區塊鏈技術以其去中心化、不可篡改的特性，為食品安全提供了可靠的解決方案。在這篇文章中，…...

编程日记 2024/9/30 22:02:43

flac格式怎么转mp3？关于flac转为MP3的方法介绍

flac格式怎么转mp3？MP3格式经过压缩，相较于flac文件，显著减小了文件体积。这一特点使得音乐的存储和传输更加便捷，尤其适合移动设备以及存储空间有限的场景。由于MP3文件体积较小，分享音乐变得非常简单，无论…...

编程日记 2024/9/30 22:00:41

【笔记】KaiOS 系统框架和应用结构（APP界面逻辑）

KaiOS系统框架最早自下而上分成Gonk-Gecko-Gaia层，代码有同名的目录，现在已经不用这种称呼。按照官网3.0的版本迭代介绍，2.5->3.0已经将系统更新成如下部分：仅分为上层web应用和底层平台核心，通过WebAPIs连接上下层，这也是kaios系统升级变更较大的部分。 KaiOS P…...

编程日记 2024/9/30 21:56:38

java项目实现钉钉异常告警实时监控

最近有个小伙伴问我，我们的项目核心业务的地方总是有异常，虽然有打印日志，但不能立马通知我；所以今天我就教大家如何实现异常报警实时提醒 1.需要有钉钉自己新建的企业用户 2.建一个群，需要有三人以上；…...

编程日记 2024/9/30 21:55:37

Spring Boot应用：电子商务平台开发

第2章关键技术简介 2.1 Java技术 Java是一种非常常用的编程语言，在全球编程语言排行版上总是前三。在方兴未艾的计算机技术发展历程中，Java的身影无处不在，并且拥有旺盛的生命力。Java的跨平台能力十分强大，只需一次编译&#xf…...

编程日记 2024/9/30 21:53:33

怎么在Vue3项目中引入Vant组件库并使用？

文章目录前言一、项目中使用步骤1.安装：2.样式的导入（2种方法）2.1 main.ts全局导入（平常自己的项目用的这个全局）2.2 按需引入组件样式 (简单介绍一下)1.安装插件2.配置插件 3.组件按需使用：App.vue 总结 …...

编程日记 2024/9/30 21:52:32

springboot中有哪些方式可以解决跨域问题

文章目录什么是跨域解决方案CrossOrigin注解实现WebMvcConfigurer接口CorsFilter过滤器如何选择？ 前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。 Talk is cheap &#xff0…...

编程日记 2024/9/30 21:51:30

Temporal Dynamic Quantization for Diffusion Models阅读

文章目录 AbstractIntroductionBackgrounds and Related Works2.1 扩散模型2.2 量化2.3 量化感知训练和训练后量化 TemporalDynamic Quantization3.1 量化方法3.2 扩散模型量化的挑战3.3 TDQ模块的实现3.4 工程细节时间步的频率编码TDQ模块的初始化 Experimental SetupResults5…...

编程日记 2024/9/30 21:48:28

828华为云征文｜华为云Flexus X实例性能实测：速度与稳定性的完美结合

828华为云征文｜华为云Flexus X实例性能实测：速度与稳定性的完美结合前言一、Flexus云服务器X实例介绍1.1 Flexus云服务器X实例简介1.2 Flexus云服务器X实例特点1.3 Flexus云服务器X实例使用场景二、实践环境介绍2.1 本次实践环境规划2.2 本次实践介绍 …...

编程日记 2024/9/30 21:47:26

【PyTorch】图像分割

图像分割是什么 Image Segmentation 将图像每一个像素分类图像分割分类超像素分割：少量超像素代替大量像素，常用于图像预处理语义分割：逐像素分类，无法区分个体实例分割：对个体目标进行分割全景分割：…...

编程日记 2024/9/30 21:45:24

如何快速建立自己的异地互联的远程视频监控系统，通过web浏览器可以直接查看公网上的监控视频（上）

目录一、需求二、方案 2.1、计划方案 2.2、实施准备 2.2.1所需配置的产品和服务 2.2.1.1云主机 （1）选择云平台 （2）配置云服务器 2.2.2.2视频监控平台软件 （1）视频监控平台软件 （2&am…...

编程日记 2024/9/30 21:44:23

实验2思科网院项目2.7.2-packet-tracer---configure-single-area-ospfv2---实践练习

实践练习 2.7.2-packet-tracer---configure-single-area-ospfv2---实践练习physical-mode 实验拓扑相关设备配置实验目标: 第 1 部分：构建网络并配置设备的基本设置第 2 部分：配置和验证单区域 OSPFv2 的基本部署第 3 部分：优化和验…...

编程日记 2024/9/30 21:42:20

Nginx实战经验分享：从小白到专家的成长历程！

目录一、Nginx概述1、Nginx简介（1）事件驱动模型（2）异步处理（3）模块化设计（4）高性能（5）反向代理（6）负载均衡（7&#xff09…...

编程日记 2024/9/30 21:37:16

从画质设置看游戏引擎（其一）

前往我的博客，获取无广告，更好的阅读体验 1. 抗锯齿（Anti-Aliasing） 1.1 锯齿问题的起因在三维模型的世界中，模型是连续的，但是屏幕像素是不连续，是离散的； 即当一个圆形显示在显…...

编程日记 2024/9/30 21:36:15

#git 问题failed to resolve head as a valid ref

问题如下： 解决方法： 1、运行 git fsck --full 可以查看具体error信息，一般都是head索引问题 2、.git\refs\heads\xxx（当前分支）txt编辑器打开显示乱码，而不是hash编码 3、在.git\logs\refs\heads\xxx&a…...

编程日记 2024/9/30 21:33:12

YOLOv11，地瓜RDK X5开发板，TROS端到端140FPS！

YOLOv11 Detect YOLOv11 Detect YOLO介绍性能数据 (简要) RDK X5 & RDK X5 Module 模型下载地址输入输出数据公版处理流程优化处理流程步骤参考环境、项目准备导出为onnxPTQ方案量化转化使用hb_perf命令对bin模型进行可视化, hrt_model_exec命令检查bin模型的输入输出情况…...

编程日记 2024/9/30 21:30:09

Python精选200Tips：181-182

针对图像的经典卷积网络结构进化史及可视化针对图像的经典卷积网络结构进化史及可视化（续）P181--MobileNet【2017】模型结构及创新性说明模型结构代码MobileNet V1版本MobileNet V2版本MobileNet V3 版本Small版本Large版本 P182--EfficientNet【2019】…...

编程日记 2024/9/30 21:28:07

[特殊字符] 智能合约中的数据是如何在区块链中保持一致的？

🧠 智能合约中的数据是如何在区块链中保持一致的？ 为什么所有区块链节点都能得出相同结果？合约调用这么复杂，状态真能保持一致吗？本篇带你从底层视角理解“状态一致性”的真相。一、智能合约的数据存储在哪里&#xf…...

编程新知 2025/10/25 17:23:41

TDengine 快速体验（Docker 镜像方式）

简介 TDengine 可以通过安装包、Docker 镜像及云服务快速体验 TDengine 的功能，本节首先介绍如何通过 Docker 快速体验 TDengine，然后介绍如何在 Docker 环境下体验 TDengine 的写入和查询功能。如果你不熟悉 Docker，请使用安装包的方式快…...

编程新知 2026/2/3 7:43:45

ffmpeg（四）：滤镜命令

FFmpeg 的滤镜命令是用于音视频处理中的强大工具，可以完成剪裁、缩放、加水印、调色、合成、旋转、模糊、叠加字幕等复杂的操作。其核心语法格式一般如下： ffmpeg -i input.mp4 -vf "滤镜参数" output.mp4或者带音频滤镜： ffmpeg…...

编程新知 2026/2/4 23:47:47

数据库分批入库

今天在工作中，遇到一个问题，就是分批查询的时候，由于批次过大导致出现了一些问题，一下是问题描述和解决方案： 示例： // 假设已有数据列表 dataList 和 PreparedStatement pstmt int batchSize 1000; // …...

编程新知 2026/1/8 11:38:36

Java线上CPU飙高问题排查全指南

一、引言在Java应用的线上运行环境中，CPU飙高是一个常见且棘手的性能问题。当系统出现CPU飙高时，通常会导致应用响应缓慢，甚至服务不可用，严重影响用户体验和业务运行。因此，掌握一套科学有效的CPU飙高问题排查方法&…...

编程新知 2025/11/2 5:30:15

基于TurtleBot3在Gazebo地图实现机器人远程控制

1. TurtleBot3环境配置 # 下载TurtleBot3核心包 mkdir -p ~/catkin_ws/src cd ~/catkin_ws/src git clone -b noetic-devel https://github.com/ROBOTIS-GIT/turtlebot3.git git clone -b noetic https://github.com/ROBOTIS-GIT/turtlebot3_msgs.git git clone -b noetic-dev…...

编程新知 2026/2/6 11:54:58