当前位置：首页 > news >正文

YOLOX算法调试记录

news 2026/3/17 13:53:22

YOLOX是在YOLOv3基础上改进而来，具有与YOLOv5相媲美的性能，其模型结构如下：

在这里插入图片描述
由于博主只是要用YOLOX做对比试验，因此并不需要对模型的结构太过了解。
先前博主调试过YOLOv5,YOLOv7，YOLOv8,相比而言，YOLOX的环境配置是类似的，但其参数设置太过分散，改动比较麻烦，就比如epoch这些参数竟然要放到yolox_base.py文件中去继承，而不是直接在train.py中指定。话不多说，我们开始调试过程。

环境配置

YOLOX的调试过程基本与YOLOv5类似，不同之处在于需要进行一个安装过程。
即执行：

python setup.py develop

否则在运行是会提示找不到yolox文件

在这里插入图片描述

运行成功后结果如下，值得注意的是，博主在本地很难成功，但在服务器上却很容易。

在这里插入图片描述

随后便是conda环境配置过程，基本与YOLOv5一致，可以直接使用命令配置：

conda create -n yolox python=3.8
source activate yolox
pip install -r requirements.txt

数据集配置

YOLOX使用的数据集是COCO，但不同在于其训练与测试中没有给出参数进行指定，而是直接写在了数据集读取文件中，我们只需要按照其要求修改目录即可，将数据集放到datasets/COCO文件夹下即可，当然也可以像博主这样创建软连接：

ln -s /data/datasets/coco/ /home/ubuntu/outputs/yolox/YOLOX-main/datasets/COCO/

但这种方法却一直报错：

File "/home/ubuntu/outputs/yolox/YOLOX-main/yolox/data/datasets/datasets_wrapper.py", line 177, in __del__
if self.cache and self.cache_type == "ram":
AttributeError: 'COCODataset' object has no attribute 'cache'

没办法，只能把数据集复制一份到这个目录了。
随后运行报错：

assert img is not None, f"file named {img_file} not found"
AssertionError: file named /home/ubuntu/outputs/yolox/YOLOX-main/datasets/COCO/val2017/000000567197.jpg not found

仔细一看原来是目录结构出了问题，没有images这级目录，去掉该目录即可。最终的目录结构为：

在这里插入图片描述

训练模型

 <class 'torch.autograd.variable.Variable'>
RuntimeError: FIND was unable to find an engine to execute this computation

这是因为博主安装环境时默认安装torch为2.0，导致出错。换个torch版本即可：

conda install pytorch==1.12.0 torchvision==0.13.0 torchaudio==0.12.0 cudatoolkit=11.6 -c pytorch -c conda-forge

随后需要修改几个参数，首先是指定模型名称，博主使用的是yolox-l

parser.add_argument("-n", "--name", type=str, default="yolox-l", help="model name")

随后设置yolox-l的配置文件，–f代表从该文件读取，然后修改对应文件中的参数：

parser.add_argument("-f","--exp_file",default="/home/ubuntu/outputs/yolox/YOLOX-main/exps/default/yolox_l.py",type=str,help="plz input your experiment description file",)

修改/home/ubuntu/outputs/yolox/YOLOX-main/exps/default/yolox_l.py，num_class设置错了，博主习惯了DETR类模型，加上了背景类，实际上应该只有3类。

在这里插入图片描述

class Exp(MyExp):def __init__(self):super(Exp, self).__init__()self.depth = 1.0self.width = 1.0self.exp_name = os.path.split(os.path.realpath(__file__))[1].split(".")[0]# Define yourself dataset pathself.train_ann = "instances_train2017.json"self.val_ann = "instances_val2017.json"self.num_classes = 4self.max_epoch = 1self.data_num_workers = 8self.print_interval=1self.eval_interval = 1

随后便是batch-szie参数了，YOLOX所占用显存还是比较大的，batch-size设置为6。

在这里插入图片描述
训练时间还是蛮快的，1个epoch大概45分钟左右。训练1个epoch的结果，由于没有使用预训练模型，值很低。还有一个问题，便是num_class设置错了，博主习惯了DETR类模型，加上了背景类，实际上应该只有3类。

在这里插入图片描述

预训练模型微调

我们可以使用YOLOX-L训练好的模型当作预训练模型，在该模型上面进行微调，从而能够快速收敛，训练好的num_class=80，我们保持原样即可，即num_class=3，模型会自动处理类别不一致的问题。使用预训练模型后，迭代速度明显加快，并且精度也迅速提升。

parser.add_argument("-c", "--ckpt", default="/home/ubuntu/outputs/yolox/YOLOX-main/yolox_l.pth.tar", type=str, help="checkpoint file")

使用预训练模型做微调后训练一个epoch的结果。
在这里插入图片描述

评估模型

完成eval.py的参数配置：

python -m yolox.tools.eval -n  yolox-s -c yolox_s.pth -b 64 -d 8 --conf 0.001 [--fp16] [--fuse]

当然也可以使用参数，主要修改这两个参数即可

在这里插入图片描述

随后运行python eval.py命令即可，这里发现使用下载的权重文件会报错，于是博主自己训练了1个epoch并保存权重结果，使用这个则是没有问题的，文件保存在YOLOX_outputs中。但似乎发现了一个问题，那就是值好低呀。

在这里插入图片描述

模型推理

首先我们下载已经训练完成的模型，博主这里选择的是YOLOX-L，值得注意的是，下载这个文件需要翻墙。下载的权重文件为tar文件，因此需要解压：

tar -xvf yolox_l.pth.tar

但没想到却报错了：

tar: This does not look like a tar archive
tar: Skipping to next header
tar: Exiting with failure status due to previous errors

这是个BUG
解决办法:

gzip -d xxxx.tar.gz （对于.tar.gz文件的处理方式）
tar -xf xxxx.tar    （对于.tar文件处理方式）

依旧不行，没办法，博主只能把其后缀名改为zip，然后使用unzip的方式解压该文件。但解压后却是一个文件夹，这与博主先前所见到的pth文件不同，果然在运行时报错：

super().init(open(name, mode)) IsADirectoryError: [Errno 21] Is a
directory: ‘/home/ubuntu/outputs/yolox/YOLOX-main/yolox_l.pth’

原来YOLOX的权重文件是不需要解压的，直接用即可，即在指定文件时为：

parser.add_argument("-c", "--ckpt", default="/home/ubuntu/outputs/yolox/YOLOX-main/yolox_l.pth.tar", type=str, help="ckpt for eval")

，指定size=224，Demo.py中给出了其参数量与计算量，
在这里插入图片描述

推理结果如下：

在这里插入图片描述

YOLOX算法调试记录

环境配置

数据集配置

训练模型

预训练模型微调

评估模型

模型推理

相关文章：

YOLOX算法调试记录

基于小程序的汽车俱乐部系统的设计与实现(论文+源码)_kaic

ProgrammingArduino物联网

SSM框架的学习与应用(Spring + Spring MVC + MyBatis)-Java EE企业级应用开发学习记录（第一天）Mybatis的学习

Programming abstractions in C阅读笔记: p118-p122

2023国赛数学建模思路 - 案例：ID3-决策树分类算法

selenium 选定ul-li下拉选项中某个指定选项

回归预测 | MATLAB实现FA-SVM萤火虫算法优化支持向量机多输入单输出回归预测（多指标，多图）

使用pytorch 的Transformer进行中英文翻译训练

解决element的select组件创建新的选项可多选且opitions数据源中有数据的情况下，回车不能自动选中创建的问题

人工智能大模型加速数据库存储模型发展行列混合存储下的破局

K8S用户管理体系介绍

实现chatGPT 聊天样式

day9 STM32 I2C总线通信

终极Shell：Zsh（CentOS7 安装 zsh 及配置 Oh my zsh）

Redis的数据持久化

CSS 选择器

上位机工作总结(2023.03-2023.08)

APSIM模型参数优化批量模拟丨气象数据准备、物候发育和光合生产、物质分配与产量模拟、土壤水分平衡算法、土壤碳氮平衡模块、农田管理模块等

Azure防火墙

解锁 C 语言 “积木术”：大一函数总结

Ubuntu 22.04 LTS 服务器 SSH 密钥配置与自动化部署实践

无人机高空工程车辆识别高清工程车辆识别高清车辆识别高清铲车压路机识别无人机矿场行人识别深度学习yolo第10558期

MedGemma-X开箱即用体验：预装环境，零配置快速体验智能诊断

StructBERT语义匹配工具实测：本地运行+GPU加速，中文复述识别效果惊艳

NOKOV度量动捕软件进阶指南：刚体与Markerset的实战配置技巧

为什么NTT负包裹卷积比普通卷积更适合密码学？深入解析其数学本质与应用优势

Phi-3-vision-128k-instruct惊艳案例：化学分子结构图→IUPAC命名→反应活性位点预测

终极指南：如何将Nebullvm与Hadoop、Spark大数据平台无缝集成

计算机毕业设计springboot中药材仓储管理系统的分析与实现基于SpringBoot框架的中药饮片智能库存与质量追溯平台中医药材冷链物流与数字化仓储运营管理系统