当前位置：首页 > news >正文

Yolov8小目标检测-添加模块改进-实验记录

news 2025/7/4 10:36:45

简介，本文通过结合了一些先进的算法改进了yolov8小目标检测能力，以下是一些记录。

数据集：足球比赛数据集，里面只有两个类别足球和人。

import os
from ultralytics import YOLOmodel = YOLO('yolov8n.yaml')  # 后缀n就调用n的模型# Train the model
model.train(data='./ultralytics/datasets/soccer.yaml', epochs=100, imgsz=640)# val
metrics = model.val()  # no arguments needed, dataset and settings remembered
metrics.box.map    # map50-95
metrics.box.map50  # map50
metrics.box.map75  # map75
metrics.box.maps  # # predict
# model.predict('datasets/soccernet/tracking/images/test/SNMOT-132/img1', save=True, imgsz=640, conf=0.5)
# results = model('datasets/soccernet/tracking/images/train/SNMOT-061/img1/')
# for result in results:
#     boxes = result.data  # Boxes object for bbox outputs
#     masks = result.masks  # Masks object for segmentation masks outputs
#     keypoints = result.keypoints  # Keypoints object for pose outputs
#     probs = result.probs  # Class probabilities for classification outputs# export
# model.export(format='onnx')

以下是我实验的一些记录：持续更新中~

实验1. baseline: 使用yolov8n.yaml训练

map: 0.371
person: 0.648
soccer: 0.095

实验2. 使用yolov8n-p2.yaml训练，四个头预测目标，大尺寸的特征图P2也预测目标。足球提升4%。

复杂度：277 layers, 3354144 parameters, 3354128 gradients, 17.3 GFLOPs
map: 0.387
person: 0.639
soccer: 0.135

实验3. 使用yolov8-p2-exp1-spdconv.yaml训练(注意调用其中的n模型需要这样调用`model = YOLO('yolov8n-p2-exp1-spdconv.yaml')`)，在yolov8后加n即可。把conv修改成spdconv，减少步长和池化对小目标检测的影响，原论文链接。

添加新模块的步骤如下：
- 1. 在ultralytics/nn/modules/conv.py下添加，space_to_depth。

- 2. 在ultralytics/nn/modules/init.py添加模块
- 3. 在ultralytics/nn/tasks.py添加模块
- 4. 在ultralytics/nn/tasks.py，添加通道数判断，用于后续提取指定序号的模块的输出。
最后新建配置文件yolov8-p2-exp1-spdconv.yaml，放置ultralytics/models/v8/yolov8-p2-exp1-spdconv.yaml，附上我的配置

# Ultralytics YOLO 🚀, AGPL-3.0 license
# YOLOv8 object detection model with P2-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect# Parameters
nc: 80  # number of classes
scales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n'# [depth, width, max_channels]n: [0.33, 0.25, 1024]s: [0.33, 0.50, 1024]m: [0.67, 0.75, 768]l: [1.00, 1.00, 512]x: [1.00, 1.25, 512]# YOLOv8.0 backbone, 修改space_to_depth后面模块的输入通道数4倍
backbone:# [from, repeats, module, args]- [-1, 1, Conv, [64, 3, 1]]  # 0-P1/2- [-1,1,space_to_depth,[1]]- [-1, 1, Conv, [128, 3, 1]]  # 128*4,2-P2/4- [-1,1,space_to_depth,[1]]- [-1, 3, C2f, [128, True]] # 128*4- [-1, 1, Conv, [256, 3, 1]]  # 5-P3/8- [-1,1,space_to_depth,[1]]- [-1, 6, C2f, [256, True]] # 256*4- [-1, 1, Conv, [512, 3, 1]]  # 8-P4/16- [-1,1,space_to_depth,[1]]- [-1, 6, C2f, [512, True]] # 512*4- [-1, 1, Conv, [1024, 3, 1]]  # 11-P5/32- [-1,1,space_to_depth,[1]]- [-1, 3, C2f, [1024, True]] # 1024*4- [-1, 1, SPPF, [1024, 5]]  # 14# YOLOv8.0-p2 head
head:- [-1, 1, nn.Upsample, [None, 2, 'nearest']]- [[-1, 10], 1, Concat, [1]]  # cat backbone P4- [-1, 3, C2f, [512]]  # 17- [-1, 1, nn.Upsample, [None, 2, 'nearest']]- [[-1, 7], 1, Concat, [1]]  # cat backbone P3- [-1, 3, C2f, [256]]  # 20 (P3/8-small)- [-1, 1, nn.Upsample, [None, 2, 'nearest']]- [[-1, 4], 1, Concat, [1]]  # cat backbone P2- [-1, 3, C2f, [128]]  # 23 (P2/4-xsmall)- [-1, 1, Conv, [128, 3, 1]]- [-1,1,space_to_depth,[1]]- [[-1, 20], 1, Concat, [1]]  # cat head P3- [-1, 3, C2f, [256]]  # 27 (P3/8-small)- [-1, 1, Conv, [256, 3, 1]]- [-1,1,space_to_depth,[1]]- [[-1, 17], 1, Concat, [1]]  # cat head P4- [-1, 3, C2f, [512]]  # 31 (P4/16-medium)- [-1, 1, Conv, [512, 3, 1]]- [-1,1,space_to_depth,[1]]- [[-1, 14], 1, Concat, [1]]  # cat head P5- [-1, 3, C2f, [1024]]  # 35 (P5/32-large)- [[23, 27, 31, 35], 1, Detect, [nc]]  # Detect(P2, P3, P4, P5)

复杂度：285 layers, 3330792 parameters, 3330776 gradients, 20.2 GFLOPs
map: -
person: -
soccer: -

实验4. 使用CoTAttention替换bottleneck里面的conv。配置文件yolov8-p2-exp2-cotattention.yaml。

添加模块步骤与上述相似，这里就贴几张图。

复杂度：349 layers, 2436264 parameters, 2436248 gradients, 10.9 GFLOPs
map: -
person: -
soccer: -

Yolov8小目标检测-添加模块改进-实验记录

简介，本文通过结合了一些先进的算法改进了yolov8小目标检测能力，以下是一些记录。数据集：足球比赛数据集，里面只有两个类别足球和人。 import os from ultralytics import YOLOmodel YOLO(yolov8n.yaml) # 后缀n就调用n的模型…...

编程日记 2023/9/13 19:08:08

2023国家网络安全宣传周|邮件安全意识培训-钓鱼篇

干货满满建议收藏反复阅读钓鱼邮件钓鱼邮件是指黑客伪装成同事、合作伙伴、朋友、家人等用户信任的人，通过发送电子邮件的方式，诱使用户回复邮件、点击嵌入邮件正文的恶意链接或者打开邮件附件以植入木马或间谍程序,进而窃取用户敏感数据、个人银行…...

编程日记 2023/9/13 19:07:07

【Leetcode】140.单词拆分II（Hard）

一、题目 1、题目描述给定一个字符串 s 和一个字符串字典 wordDict ，在字符串 s 中增加空格来构建一个句子，使得句子中所有的单词都在词典中。以任意顺序返回所有这些可能的句子。注意：词典中的同一个单词可能在分段中被重复使用多次。示例1：输入: s = "cat…...

编程日记 2023/9/13 19:06:06

【数据结构-堆】堆

💝💝💝欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kuan 的首页,持续学…...

编程日记 2023/9/13 19:04:03

Ansible 自动化运维工具部署主从数据库+读写分离

文章目录 Ansible 自动化运维工具部署主从数据库读写分离一、主从复制和读写分离介绍二、准备工作（1）节点规划（2）修改主机名（3）免密（4）配置IP映射（5）安装ansi…...

编程日记 2023/9/13 19:02:00

蓝桥杯官网填空题（星期几）

题目描述本题为填空题，只需要算出结果后，在代码中使用输出语句将所填结果输出即可。 1949 年的国庆节（ 10 月 1 日）是星期六。今年（2012）的国庆节是星期一。那么，从建国到现在&#xff0…...

编程日记 2023/9/13 18:58:56

《向量数据库指南》——向量数据库会是 AI 的“iPhone 时刻”吗？

最近一年，以 ChatGPT、LLaMA 为代表的大语言模型的兴起，将向量数据库的发展推向了新的高度。向量数据库是一种在机器学习和人工智能领域日益流行的新型数据库，它能够帮助支持基于神经网络而不是关键字的新型搜索引擎。向量数据库不同于传统的关系型数据库，例如 PostgreSQ…...

编程日记 2023/9/13 18:57:55

案例实践丨基于SkyWalking全链路监控的微服务系统性能调优实践篇

1背景随着开源社区和云计算的快速推进，云原生微服务作为新型应用系统的核心架构，得到了越来越广泛的应用。根据Gartner对微服务的定义：“微服务是范围狭窄、封装紧密、松散耦合、可独立部署且可独立伸缩的应用程序组件。” 微服务之父&…...

编程日记 2023/9/13 18:55:53

C++信息学奥赛1170：计算2的N次方

#include <iostream> #include <string> #include <cstring>using namespace std;int main() {int n;cin >> n; // 输入一个整数nint arr[100];memset(arr, -1, sizeof(arr)); // 将数组arr的元素初始化为-1，sizeof(arr)表示arr数组的字节…...

编程日记 2023/9/13 18:53:51

windos本地文件上传到ubuntu

如何把本地文件放到服务器上 scp /path/to/local/file usernameserver:/path/to/remote/directoryusernameserver 是服务器名和IP...

编程日记 2023/9/13 18:51:49

做软件测试，掌握哪些技术才能算作“测试大佬”？

一、过硬的基础能力其实所有的测试大佬都是从底层基础开始的，随着时间，经验的积累慢慢变成大佬。要想稳扎稳打在测试行业深耕，成为测试大牛，首当其冲的肯定就是拥有过硬的基础，所有的基础都是根基，后期所有…...

编程日记 2023/9/13 18:50:48

【算法与数据结构】530、LeetCode二叉搜索树的最小绝对差

文章目录一、题目二、解法三、完整代码所有的LeetCode题解索引，可以看这篇文章——【算法和数据结构】LeetCode题解。一、题目二、解法思路分析：二叉搜索树的性质是左子树的所有节点键值小于中间节点键值，右子树的所有节点键值大于中间节…...

编程日记 2023/9/13 18:48:46

input输入事件

我要实现input输入框一边输入，一边在控制台输出结果现有如下代码 <body><input type"text" onchange"myFunction()" /><script>function myFunction(){console.log(999)}</script> </body> 当敲下回车键后才会…...

编程日记 2023/9/13 18:46:41

接入 NVIDIA A100、吞吐量提高 10 倍！Milvus GPU 版本使用指南

Milvus 2.3 正式支持 NVIDIA A100！ 作为为数不多的支持 GPU 的向量数据库产品，Milvus 2.3 在吞吐量和低延迟方面都带来了显著的变化，尤其是与此前的 CPU 版本相比，不仅吞吐量提高了 10 倍，还能将延迟控制在极低的水准。…...

编程日记 2023/9/13 18:45:40

php://filter协议在任意文件读取漏洞（附例题）

php://filter php://fiter 中文叫元器封装，咱也不知道为什么这么翻译，目前我的理解是可以通过这个玩意对上面提到的php IO流进行处理，及现在可以对php的 IO流进行一定操作。过滤器：及通过php://filter 对php 的IO流进行的具体…...

编程日记 2023/9/13 18:44:39

【Redis】1、NoSQL之Redis的配置及优化

关系数据库与非关系数据库关系型数据库关系型数据库是一个结构化的数据库，创建在关系模型（二维表格模型）基础上，一般面向于记录。 SQL 语句（标准数据查询语言）就是一种基于关系型数据库的语言&a…...

编程日记 2023/9/13 18:40:35

9.5QTday6作业

面试题1：c语言中的static和c中的static的用法在c语言中： 1.static修饰的全局变量作用域限制在当前文件，无法被外部文件所引用。2.static修饰的局部变量延长生命周期，但不改变作用域，同样无法被外部文件所引用。3.st…...

编程日记 2023/9/13 18:39:34

Redis I/O多路复用机制

一、基础回顾 1.1 多路复用要解决什么问题并发多客户端连接场景，在多路复用之前最简单和典型的方案就是同步阻塞网络IO模型。这种模式的特点就是用一个进程来处理一个网络连接(一个用户请求),比如一段典型的示例代码如下。直接调用 recv 函数从一个 socket 上…...

编程日记 2023/9/13 18:38:32

Matlab 2016安装MinGW-w64-4.9.2

Matlab 2016安装MinGW-w64-4.9.2 项目需求：需要将matlab中的.m文件编译为cpp文件 .dll .h .lib。我相信大家在对matlab2016安装MinGW-w64出现了各种各样的问题。如：4.9.2安装失败；安装了其他版本但是matlab检测不到，或者其他各种…...

编程日记 2023/9/13 18:34:27

Tomcat配置ssl、jar包

Tomcat配置ssl 部署tomcat服务，项目做到用https访问，使用nginx去做，访问任意一个子网站，都是https 或者医美项目需要上传jdk 456 tomcat war包 [nginx-stable] namenginx stable repo baseurlhttp://nginx.org/packages/…...

编程日记 2023/9/13 18:32:25

为什么需要建设工程项目管理？工程项目管理有哪些亮点功能？

在建筑行业，项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升，传统的管理模式已经难以满足现代工程的需求。过去，许多企业依赖手工记录、口头沟通和分散的信息管理，导致效率低下、成本失控、风险频发。例如&#…...

编程新知 2025/7/3 12:17:49

连锁超市冷库节能解决方案：如何实现超市降本增效

在连锁超市冷库运营中，高能耗、设备损耗快、人工管理低效等问题长期困扰企业。御控冷库节能解决方案通过智能控制化霜、按需化霜、实时监控、故障诊断、自动预警、远程控制开关六大核心技术，实现年省电费15%-60%，且不改动原有装备、安装快捷、…...

编程新知 2025/6/25 0:28:07

使用van-uploader 的UI组件，结合vue2如何实现图片上传组件的封装

以下是基于 vant-ui（适配 Vue2 版本 ）实现截图中照片上传预览、删除功能，并封装成可复用组件的完整代码，包含样式和逻辑实现，可直接在 Vue2 项目中使用： 1. 封装的图片上传组件 ImageUploader.vue <te…...

编程新知 2025/6/17 5:20:48

【算法训练营Day07】字符串part1

文章目录反转字符串反转字符串II替换数字反转字符串题目链接：344. 反转字符串双指针法，两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...

编程新知 2025/6/25 3:04:08

Linux云原生安全：零信任架构与机密计算

Linux云原生安全：零信任架构与机密计算构建坚不可摧的云原生防御体系引言：云原生安全的范式革命随着云原生技术的普及，安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测，到2025年，零信任架构将成为超…...

编程新知 2025/7/4 6:22:16

优选算法第十二讲：队列 + 宽搜优先级队列

优选算法第十二讲：队列宽搜 && 优先级队列 1.N叉树的层序遍历2.二叉树的锯齿型层序遍历3.二叉树最大宽度4.在每个树行中找最大值5.优先级队列 -- 最后一块石头的重量6.数据流中的第K大元素7.前K个高频单词8.数据流的中位数 1.N叉树的层序遍历 2.二叉树的锯…...

编程新知 2025/7/4 2:24:09

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join 1、依赖1.1、依赖版本1.2、pom.xml 2、代码2.1、SqlSession 构造器2.2、MybatisPlus代码生成器2.3、获取 config.yml 配置2.3.1、config.yml2.3.2、项目配置类 2.4、ftl 模板2.4.1、…...

编程新知 2025/6/19 0:27:55

Kafka主题运维全指南：从基础配置到故障处理

#作者：张桐瑞文章目录主题日常管理1. 修改主题分区。2. 修改主题级别参数。3. 变更副本数。4. 修改主题限速。5.主题分区迁移。6. 常见主题错误处理常见错误1：主题删除失败。常见错误2：__consumer_offsets占用太多的磁盘。主题日常管理 …...

编程新知 2025/6/10 21:14:43

ubuntu系统文件误删(/lib/x86_64-linux-gnu/libc.so.6)修复方案 [成功解决]

报错信息：libc.so.6: cannot open shared object file: No such file or directory： #ls, ln, sudo...命令都不能用 error while loading shared libraries: libc.so.6: cannot open shared object file: No such file or directory重启后报错信息&…...

编程新知 2025/7/3 12:51:47

第一篇：Liunx环境下搭建PaddlePaddle 3.0基础环境（Liunx Centos8.5安装Python3.10+pip3.10）

第一篇：Liunx环境下搭建PaddlePaddle 3.0基础环境（Liunx Centos8.5安装Python3.10pip3.10） 一：前言二：安装编译依赖二：安装Python3.10三：安装PIP3.10四：安装Paddlepaddle基础框架4.1…...

编程新知 2025/7/4 2:11:03