当前位置：首页 > news >正文

YOLOv5：对yolov5n模型进一步剪枝压缩

news 文章来源：https://blog.csdn.net/FriendshipTang/article/details/132712208 2025/4/19 23:57:44

YOLOv5：对yolov5n模型进一步剪枝压缩

前言
前提条件
相关介绍
具体步骤
- 修改yolov5n.yaml配置文件
- 单通道数据（黑白图片）
- - 修改models/yolo.py文件
  - 修改train.py文件
- 剪枝后模型大小
参考

前言

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入YOLO系列专栏、自然语言处理
专栏或我的个人主页查看
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

前提条件

熟悉Python

具体步骤

修改yolov5n.yaml配置文件

YOLOv5相关YAML配置里面参数含义，可查阅YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层：
https://blog.csdn.net/FriendshipTang/article/details/130375883
这里顺带解释一下，depth_multiple和width_multiple参数含义。

# YOLOv5 🚀 by Ultralytics, GPL-3.0 license# Parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple

 - nc: 8 代表数据集中的类别数目。- depth_multiple: 0.33- 用来控制模型的深度，仅在number≠1时启用。- 如第一个C3层的参数设置为[-1, 3, C3, [128]]，其中number=3，表示在yolov5s中含有 3 × 0.33 ≈ 1个C3。- width_multiple: 0.50- 用来控制模型的宽度，主要作用于args中的channel_out。- 如第一个Conv层，输出通道数channel_out=64，那么在yolov5s中，会将卷积过程中的卷积核设置为 64 × 0.50 = 32，所以会输出 32 通道的特征图。

将

depth_multiple: 0.33  # model depth multiple
width_multiple: 0.25  # layer channel multiple

改为

depth_multiple: 0.16  # model depth multiple
width_multiple: 0.125  # layer channel multiple

即可达到减少卷积层数的目的。
在这里插入图片描述

单通道数据（黑白图片）

如果数据集是单通道数据，即黑白图片数据集，还可以修改训练时输入的通道数（yolov5默认输入通道数ch=3,我们可以修改ch=1），减少训练参数。
如果是彩色图片数据集，可跳过此部分的内容。

修改models/yolo.py文件

        if m in {Conv, GhostConv, Bottleneck, GhostBottleneck, SPP, SPPF, DWConv, MixConv2d, Focus, CrossConv,BottleneckCSP, C3, C3TR, C3SPP, C3Ghost, nn.ConvTranspose2d, DWConvTranspose2d, C3x}:c1, c2 = ch[f], args[0]if c2 != no:  # if not outputc2 = make_divisible(c2 * gw, 8)

添加:

        if m in (Conv, GhostConv, Bottleneck, GhostBottleneck, SPP, SPPF, DWConv, MixConv2d, Focus, CrossConv,BottleneckCSP, C3, C3TR, C3SPP, C3Ghost, nn.ConvTranspose2d, DWConvTranspose2d, C3x):c1, c2 = ch[f], args[0]# 添加的内容if i == 0: # 第一层输入，为单通道图片c1 = 1if c2 != no:  # if not outputc2 = make_divisible(c2 * gw, 8)

在这里插入图片描述

        # Define modelch = self.yaml['ch'] = self.yaml.get('ch', ch)  # input channels

添加:

        # Define modelch = self.yaml['ch'] = self.yaml.get('ch', ch)  # input channels# 添加的内容self.yaml['ch'] = 1ch = self.yaml['ch']

在这里插入图片描述

修改train.py文件

model = Model(cfg or ckpt['model'].yaml, ch=3, nc=nc, anchors=hyp.get('anchors')).to(device)  # create

改为

# 修改的内容
# model = Model(cfg or ckpt['model'].yaml, ch=3, nc=nc, anchors=hyp.get('anchors')).to(device)  # create
model = Model(cfg or ckpt['model'].yaml, ch=1, nc=nc, anchors=hyp.get('anchors')).to(device)  # create

在这里插入图片描述

model = Model(cfg, ch=3, nc=nc, anchors=hyp.get('anchors')).to(device)  # create

改为

# 修改的内容
# model = Model(cfg, ch=3, nc=nc, anchors=hyp.get('anchors')).to(device)  # create
model = Model(cfg, ch=1, nc=nc, anchors=hyp.get('anchors')).to(device)  # create

在这里插入图片描述

for i, (imgs, targets, paths, _) in pbar:  # batch -------------------------------------------------------------callbacks.run('on_train_batch_start')ni = i + nb * epoch  # number integrated batches (since train start)imgs = imgs.to(device, non_blocking=True).float() / 255  # uint8 to float32, 0-255 to 0.0-1.0# Warmupif ni <= nw:xi = [0, nw]  # x interp# compute_loss.gr = np.interp(ni, xi, [0.0, 1.0])  # iou loss ratio (obj_loss = 1.0 or iou)accumulate = max(1, np.interp(ni, xi, [1, nbs / batch_size]).round())for j, x in enumerate(optimizer.param_groups):# bias lr falls from 0.1 to lr0, all other lrs rise from 0.0 to lr0x['lr'] = np.interp(ni, xi, [hyp['warmup_bias_lr'] if j == 0 else 0.0, x['initial_lr'] * lf(epoch)])if 'momentum' in x:x['momentum'] = np.interp(ni, xi, [hyp['warmup_momentum'], hyp['momentum']])

添加:

for i, (imgs, targets, paths, _) in pbar:  # batch -------------------------------------------------------------callbacks.run('on_train_batch_start')ni = i + nb * epoch  # number integrated batches (since train start)# imgs = imgs.to(device, non_blocking=True).float() / 255  # uint8 to float32, 0-255 to 0.0-1.0# 添加的内容，目的是将训练集的图片变为单通道图片(黑白图片)imgs = imgs[:, 0, :, :].unsqueeze(1).to(device, non_blocking=True).float() / 255 # Warmupif ni <= nw:xi = [0, nw]  # x interp# compute_loss.gr = np.interp(ni, xi, [0.0, 1.0])  # iou loss ratio (obj_loss = 1.0 or iou)accumulate = max(1, np.interp(ni, xi, [1, nbs / batch_size]).round())for j, x in enumerate(optimizer.param_groups):# bias lr falls from 0.1 to lr0, all other lrs rise from 0.0 to lr0x['lr'] = np.interp(ni, xi, [hyp['warmup_bias_lr'] if j == 0 else 0.0, x['initial_lr'] * lf(epoch)])if 'momentum' in x:x['momentum'] = np.interp(ni, xi, [hyp['warmup_momentum'], hyp['momentum']])

在这里插入图片描述

剪枝后模型大小

原来的yolo5n模型大小为3.5m，剪枝训练后的yolo5n模型大小为2.6m。

参考

[1] https://github.com/ultralytics/yolov5

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入YOLO系列专栏、自然语言处理
专栏或我的个人主页查看
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

YOLOv5：对yolov5n模型进一步剪枝压缩

YOLOv5：对yolov5n模型进一步剪枝压缩前言前提条件相关介绍具体步骤修改yolov5n.yaml配置文件单通道数据（黑白图片）修改models/yolo.py文件修改train.py文件剪枝后模型大小参考前言由于本人水平有限，难免出现错漏，…...

编程日记 2023/9/7 10:51:43

大数据(八)：Pandas的基础应用详解(五)

专栏介绍结合自身经验和内部资料总结的Python教程，每天3-5章，最短1个月就能全方位的完成Python的学习并进行实战开发，学完了定能成为大佬！加油吧！卷起来！全部文章请访问专栏：《Python全栈教程（0基础）》再推荐一下最近热更的：《大厂测试高频面试题详解》该专栏对…...

编程日记 2023/9/7 10:50:42

【算法】归并排序详解

归并排序详解归并排序代码实现1. 递归版本2. 非递归版本排序： 排序，就是使一串记录，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作。稳定性： 假定在待排序的记录序列中，存在多个具有相…...

编程日记 2023/9/7 10:49:41

linux 进程隔离Namespace 学习

一、linux namespace 介绍 1.1、概念 Linux Namespace是Linux内核提供的一种机制，它用于隔离不同进程的资源视图，使得每个进程都拥有独立的资源空间，从而实现进程之间的隔离和资源管理。 Linux Namespace的设计目标是为了解决多个进程之间…...

编程日记 2023/9/7 10:48:39

【MySQL】事务详解

事务详解一. 为什么使用事务二. 事务的概念三. 使用四. 事务的特性原子性（Atomicity）一致性（Consistency）隔离性（Isolation）持久性（Durability） 五. 事务并发所带来的问题脏读问题…...

编程日记 2023/9/7 10:47:37

爬虫到底难在哪里？

目录爬虫到底难在哪里怎么学习爬虫注意事项爬虫工具总结学习Python爬虫的难易程度因人而异，对于具备编程基础的人来说，学习Python爬虫并不困难。Python语言本身比较简单易学，适合初学者使用。爬虫到底难在哪里爬虫的难点主要包…...

编程日记 2023/9/7 10:46:36

linux常用命令行整理

1、linux的以及目录 bin 二进制可执行文件sbin 二进制可执行文件(root用户权限)etc 系统管理和配置文件,例如常见host文件home 用户文件的根目录usr 用户存放系统应用程序(共享系统资源)opt 可选的应用程序proc 虚拟文件系统root 超级用户dev 存放设备文件mnt 系统管理员安装临…...

编程日记 2023/9/7 10:45:35

python字符串相关

python字符串相关一、reverse() 函数只能反转列表二、reversed() 反转元组字符串等等返回迭代器三、join和reversed反转字符串四、join串联字符串（join连接对象仅限字符串、储存字符串的元组、列表、字典）数字对象可通过str()转化为字符串⭐对象为字…...

编程日记 2023/9/7 10:44:35

JavaScript学习笔记01

JavaScript笔记01 什么是 JavaScript JavaScript 是一门世界上最流行的脚本语言，它是一种弱类型的脚本语言，其代码不需要经过编译，而是由浏览器解释运行，用于控制网页的行为。发展历史参考：JavaScript的起源故事…...

编程日记 2023/9/7 10:43:33

golang 通用的 grpc http 基础开发框架

go-moda golang 通用的 grpc http 基础开发框架仓库地址: https://github.com/webws/go-moda仓库一直在更新,欢迎大家吐槽和指点特性 transport: 集成 http（echo、gin）和 grpc。tracing: openTelemetry 实现微务链路追踪pprof: 分析性能config: 通用…...

编程日记 2023/9/7 10:42:32

FSK解调技术的FPGA实现

本原创文章由深圳市小眼睛科技有限公司创作，版权归本公司所有，如需转载，需授权并注明出处一、FSK信号的解调原理 FSK信号的解调也有非相干和相干两种，FSK信号可以看作是用两个频率源交替传输得到的，所以FSK的接收机由…...

编程日记 2023/9/7 10:41:31

Matlab图像处理-高斯低通滤波器

高通滤波图像的边缘、细节主要位于高频部分，而图像的模糊是由于高频成分比较弱产生的。高通滤波就是为了高消除模糊，突出边缘。因此采用高通滤波器让高频成分通过，消除低频噪声成分削弱，再经傅里叶逆变换得到边缘锐化的图像。 …...

编程日记 2023/9/7 10:40:30

文件上传之图片马混淆绕过与条件竞争

一、图片马混淆绕过 1.上传gif imagecreatefromxxxx函数把图片内容打散，，但是不会影响图片正常显示 $is_upload false; $msg null; if (isset($_POST[submit])){// 获得上传文件的基本信息，文件名，类型，大小&…...

编程日记 2023/9/7 10:39:27

代码随想录二刷day16

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、力扣104. 二叉树的最大深度二、力扣559. N 叉树的最大深度三、力扣111. 二叉树的最小深度三、力扣力扣222. 完全二叉树的节点个数前言一、力扣104. 二叉树…...

编程日记 2023/9/7 10:37:25

【开发】安防监控/视频存储/视频汇聚平台EasyCVR优化播放体验的小tips

视频云存储/安防监控EasyCVR视频汇聚平台基于云边端智能协同，可实现视频监控直播、视频轮播、视频录像、云存储、回放与检索、智能告警、服务器集群、语音对讲、云台控制、电子地图、H.265自动转码H.264、平台级联等。为了便于用户二次开发、调用与集成，…...

编程日记 2023/9/7 10:36:24

力扣（LeetCode）算法_C++—— 只出现一次的数字

给你一个非空整数数组 nums ，除了某个元素只出现一次以外，其余每个元素均出现两次。找出那个只出现了一次的元素。你必须设计并实现线性时间复杂度的算法来解决此问题，且该算法只使用常量额外空间。示例 1 ： 输入&#xff1…...

编程日记 2023/9/7 10:35:22

Windows配置SonarQube代码审查工具详细步骤（附带IDEA SonarLint插件使用）

文章目录环境说明以及准备一. SonarQube的下载与安装二. 添加SonarQube项目三. 使用Maven命令上传代码到SonarQube四. IDEA安装SonarLint插件环境说明以及准备本篇博客使用的SonarQube版本为9.8，注意JDK 1.8已经不能支持 NameVersionDownLoad LinkSonarQube9.8…...

编程日记 2023/9/7 10:34:21

【Unity3D】UI Toolkit元素

1 前言 UI Toolkit简介中介绍了 UI Builder、样式属性、UQuery、Debugger，UI Toolkit容器中介绍了 VisualElement、ScrollView、ListView、GroupBox 等容器，UI Toolkit样式选择器中介绍了简单选择器、复杂选择器、伪类选择器等样式选择器，…...

编程日记 2023/9/7 10:33:20

Task :app:compileDebugKotlin FAILED

gradle.properties 里面加上 android.enableJetifiertrue...

编程日记 2023/9/7 10:32:18

Android——数据存储（一）（二十一）

1. 数据存储 1.1 知识点 （1）掌握Android数据存储的分类； （2）可以使用SharedPreferences存储数据。 1.2 具体内容对于我们数据的存储而言，Android一共提供了5个数据存储的方式：SharedPrefe…...

编程日记 2023/9/7 10:31:17

机器学习课后习题 ---数学基础回顾

（一）选择题 1.函数y=1/(x+1)是 A.偶函数 B.奇函数 C.单调函数 D.无界函数 2.设f(sin（x/2）=cosx+1,则f（x）为（） A.2x-2 B.2-2x C.1+2 …...

编程日记 2023/9/7 10:30:15

CS420 课程笔记 P4 - 以16进制形态编辑游戏文件

文章目录 IntroductionFinding save filesStringsUnicodeExample!Value searchHealth searchConclusion Introduction 这节课我们将学习编辑十六进制，主要用于编辑保存文件，但十六进制编辑涉及的技能可以很好地转移到： Save file editingRe…...

编程日记 2023/9/7 10:29:14

计算机毕设之Python的高校成绩分析（含文档+源码+部署）

本系统阐述的是一个高校成绩分析系统的设计与实现，对于Python、B/S结构、MySql进行了较为深入的学习与应用。主要针对系统的设计，描述，实现和分析与测试方面来表明开发的过程。开发中使用了 django框架和MySql数据库技术搭建系统的整体架构。…...

编程日记 2023/9/7 10:28:13

【Sentinel】核心API-Entry与Context

文章目录一、Entry1、Entry的声明2、使用API自定义资源3、基于SentinelResource注解标记资源二、Context1、Context介绍2、Context的初始化3、AbstractSentinelInterceptor4、ContextUtil 一、Entry 1、Entry的声明默认情况下，Sentinel会将controller中的方法作…...

编程日记 2023/9/7 10:27:12

HashMap源码阅读解惑

HashMap的hash函数（1.8） 首先1.7的是四次扰动，1.8做了优化。简单的说就是对key做hashCode操作，然后将得到的32为散列值向右位移16位，再与hashCode做异或计算。实质上是把一个数的低16位与他的高16位做异或运算。 st…...

编程日记 2023/9/7 10:26:11

如何解决前端传递数据给后端时精度丢失问题

解决精度丢失有时候我们在进行修改操作时，发现修改既不报错也不生效。我们进行排查后发现服务器端将数据返回给前端时没有出错，但是前端js将数据进行处理时却出错了，因为id是Long类型的，而js在处理后端返回给前端的Long类型数据…...

编程日记 2023/9/7 10:25:10

使用Maven创建父子工程

📚目录创建父工程创建子模块创建子模块示例创建认证模块(auth) 结束创建父工程选择空项目： 设置：项目名称，组件名称，版本号等创建完成后的工程因为我们需要设置这个工程为父工程所以不需要src下的所有文件在pom…...

编程日记 2023/9/7 10:24:09

import JSZipUtils from "jszip-utils"; import JSZip from "pizzip"; import Docxtemplater from "docxtemplater"; npm安装以上依赖首先维护个word模板导出方法 //导出wordskipOutWord(row) {var printData rowconst data JSON.parse(JS…...

编程日记 2023/9/7 10:23:08

数学建模-点评笔记 9月3日

1.摘要：关键方法和结论（精炼的语言）要说明，方法的合理性和意义也可以说明。评委先通过摘要筛选（第一轮） 2.时间序列找异常值除了3西格玛还有针对时间序列更合适寻找的方法 3.模型的优缺点要写的详细一点…...

编程日记 2023/9/7 10:22:07

使用Spring来管理对象关系映射（ORM）

简介对象关系映射（Object-Relational Mapping，简称ORM）是一种技术，用于在面向对象程序和关系型数据库之间进行数据的映射。Spring框架提供了强大的支持来简化和优化ORM开发过程。本文将介绍如何使用Spring来管理对象关系映射。 …...

编程日记 2023/9/7 10:21:04

YOLOv5：对yolov5n模型进一步剪枝压缩

前言

前提条件

相关介绍

具体步骤

修改yolov5n.yaml配置文件

单通道数据（黑白图片）

修改models/yolo.py文件

修改train.py文件

剪枝后模型大小

参考

相关文章：