当前位置：首页 > news >正文

【深度学习目标检测】四、基于深度学习的抽烟识别（python，yolov8）

news 2025/7/11 12:38:24

YOLOv8是一种物体检测算法，是YOLO系列算法的最新版本。

YOLO（You Only Look Once）是一种实时物体检测算法，其优势在于快速且准确的检测结果。YOLOv8在之前的版本基础上进行了一系列改进和优化，提高了检测速度和准确性。

YOLOv8采用了Darknet-53作为其基础网络架构。Darknet-53是一个53层的卷积神经网络，用于提取图像特征。与传统的卷积神经网络相比，Darknet-53具有更深的网络结构和更多的卷积层，可以更好地捕捉图像中的细节和语义信息。

在YOLOv8中，还使用了一些技术来提高检测性能。首先是使用了多尺度检测。YOLOv8在不同的尺度上检测物体，这样可以更好地处理物体的大小变化和远近距离差异。其次是利用了FPN（Feature Pyramid Network）结构来提取多尺度特征。FPN可以将不同层级的特征图进行融合，使得算法对不同大小的物体都有较好的适应性。

此外，YOLOv8还利用了一种称为CSPDarknet的网络结构来减少计算量。CSPDarknet使用了CSP（Cross Stage Partial）结构，在网络的前向和后向传播过程中进行特征融合，从而减少了网络的参数量和计算量。

在训练阶段，YOLOv8使用了一种称为CutMix的数据增强技术。CutMix将不同图像的一部分进行混合，从而增加了数据的多样性和鲁棒性。

总而言之，YOLOv8是一种快速而准确的物体检测算法，它通过引入Darknet-53网络、多尺度检测、FPN结构、CSPDarknet结构和CutMix数据增强等技术，实现了对不同大小和距离的物体进行快速、准确的检测。

本文介绍了基于Yolov8的抽烟检测模型，包括训练过程和数据准备过程，同时提供了推理的代码。对准备计算机视觉相关的毕业设计的同学有着一定的帮助。

效果如下图：

一、安装YoloV8

yolov8官方文档：https://docs.ultralytics.com/zh/

安装部分参考：官方安装教程

二、数据集准备

抽烟数据集共包含705个训练图片，78个验证图片，图片示例如下：

原始的数据格式为VOC格式，本文提供转换好的yolov8格式数据集，，可以直接放入yolov8中训练，数据集地址：抽烟数据集yolov8格式

三、修改yolov8配置文件

1、修改数据集配置文件

将path替换成自己的数据集路径：

# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO 2017 dataset http://cocodataset.org by Microsoft
# Example usage: yolo train data=coco.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco  ← downloads here (20.1 GB)# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: datasets/smoke/pp_smoke-yolov8  # 更改为自己的数据集路径，建议绝对路ing
train: images/train 
val: images/val  
test: images/val  # Classes
names:0: smoke

2、配置模型文件

模型配置文件如下，将nc改成1：

# Ultralytics YOLO 🚀, AGPL-3.0 license
# YOLOv8 object detection model with P3-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect# Parameters
nc: 1  # number of classes
scales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n'# [depth, width, max_channels]n: [0.33, 0.25, 1024]  # YOLOv8n summary: 225 layers,  3157200 parameters,  3157184 gradients,   8.9 GFLOPss: [0.33, 0.50, 1024]  # YOLOv8s summary: 225 layers, 11166560 parameters, 11166544 gradients,  28.8 GFLOPsm: [0.67, 0.75, 768]   # YOLOv8m summary: 295 layers, 25902640 parameters, 25902624 gradients,  79.3 GFLOPsl: [1.00, 1.00, 512]   # YOLOv8l summary: 365 layers, 43691520 parameters, 43691504 gradients, 165.7 GFLOPsx: [1.00, 1.25, 512]   # YOLOv8x summary: 365 layers, 68229648 parameters, 68229632 gradients, 258.5 GFLOPs# YOLOv8.0n backbone
backbone:# [from, repeats, module, args]- [-1, 1, Conv, [64, 3, 2]]  # 0-P1/2- [-1, 1, Conv, [128, 3, 2]]  # 1-P2/4- [-1, 3, C2f, [128, True]]- [-1, 1, Conv, [256, 3, 2]]  # 3-P3/8- [-1, 6, C2f, [256, True]]- [-1, 1, Conv, [512, 3, 2]]  # 5-P4/16- [-1, 6, C2f, [512, True]]- [-1, 1, Conv, [1024, 3, 2]]  # 7-P5/32- [-1, 3, C2f, [1024, True]]- [-1, 1, SPPF, [1024, 5]]  # 9# YOLOv8.0n head
head:- [-1, 1, nn.Upsample, [None, 2, 'nearest']]- [[-1, 6], 1, Concat, [1]]  # cat backbone P4- [-1, 3, C2f, [512]]  # 12- [-1, 1, nn.Upsample, [None, 2, 'nearest']]- [[-1, 4], 1, Concat, [1]]  # cat backbone P3- [-1, 3, C2f, [256]]  # 15 (P3/8-small)- [-1, 1, Conv, [256, 3, 2]]- [[-1, 12], 1, Concat, [1]]  # cat head P4- [-1, 3, C2f, [512]]  # 18 (P4/16-medium)- [-1, 1, Conv, [512, 3, 2]]- [[-1, 9], 1, Concat, [1]]  # cat head P5- [-1, 3, C2f, [1024]]  # 21 (P5/32-large)- [[15, 18, 21], 1, Detect, [nc]]  # Detect(P3, P4, P5)

3、训练模型

使用如下命令开始训练（将相关路径改成自己的路径，建议改成绝对路径）：

yolo detect train project=deploy name=yolov8_smoke exist_ok=True optimizer=auto val=True amp=True epochs=100  imgsz=640 model=ultralytics/ultralytics/cfg/models/v8/yolov8_smoke.yaml  data=ultralytics/ultralytics/cfg/datasets/smoke.yaml

4、评估模型

使用如下命令评估：

yolo detect val imgsz=640 model=deploy/yolov8_smoke/weights/best.pt data=ultralytics/ultralytics/cfg/datasets/smoke.yaml

精度如下：

5、推理

推理代码如下：

from PIL import Image
from ultralytics import YOLO# 加载预训练的YOLOv8n模型
model = YOLO('best.pt')# 在'bus.jpg'上运行推理
image_path = 'smoke_a205.jpg'
results = model(image_path)  # 结果列表# 展示结果
for r in results:im_array = r.plot()  # 绘制包含预测结果的BGR numpy数组im = Image.fromarray(im_array[..., ::-1])  # RGB PIL图像im.show()  # 显示图像im.save('results.jpg')  # 保存图像

四、相关资料

本文在训练好的模型和推理代码：推理代码和权重

【深度学习目标检测】四、基于深度学习的抽烟识别（python，yolov8）

YOLOv8是一种物体检测算法，是YOLO系列算法的最新版本。 YOLO（You Only Look Once）是一种实时物体检测算法，其优势在于快速且准确的检测结果。YOLOv8在之前的版本基础上进行了一系列改进和优化，提高了检测速度和准确性。…...

编程日记 2023/12/18 4:04:35

YML学习

讲解YML使用场景、语法和解析 1.基础知识1.1 什么是YML1.2 YML优点1.3 YML使用场景 2.YML语法2.1 基础语法2.2 字面量数据类型2.2.1 字符串2.2.2 NULL2.4.5 时间戳（timestamp） 2.3 对象\MAP类型2.4 数组/List/Set2.4.1 值为基础类型2.4.2 值为对象2.4.3 …...

编程日记 2023/12/18 4:02:33

华为HCIP认证H12-821题库下

26、6.交换技术核心知识 （单选题）某交换机运行RSTP协议，其相关配置信息如图所示,请根据命令配置情况指出对于Instance 1，该交换机的角色是: A、根交换机 B、非根交换机 C、交换机 D、无法判断正确答案是&…...

编程日记 2023/12/18 4:01:32

01--二分查找

一. 初识算法 1.1 什么是算法？ 在数学和计算机科学领域，算法是一系列有限的严谨指令，通常用于解决一类特定问题或执行计算不正式的说，算法就是任何定义优良的计算过程：接收一些值作为输入，在有限的时间…...

编程日记 2023/12/18 3:58:28

初识大数据应用，一文掌握大数据知识文集(1)

文章目录 🏆初识大数据应用知识🔎一、初识大数据应用知识(1)🍁 01、请用Java实现非递归二分查询？🍁 02、是客户端还是Namenode决定输入的分片？🍁 03、mapred.job.tracker命令的作用？…...

编程日记 2023/12/18 3:57:27

Kafka生产问题总结及性能优化实践

1、消息丢失情况消息发送端： （1）acks0： 表示producer不需要等待任何broker确认收到消息的回复，就可以继续发送下一条消息。性能最高，但是最容易丢消息。大数据统计报表场景，对性能要求很高&am…...

编程日记 2023/12/18 3:54:24

[MySQL]数据库原理2，Server，DataBase，Connection，latin1、UTF-8，gb2312，Encoding，Default Collation——喵喵期末不挂科

希望你开心，希望你健康，希望你幸福，希望你点赞！ 最后的最后，关注喵，关注喵，关注喵，佬佬会看到更多有趣的博客哦！！！ 喵喵喵，你对我真的…...

编程日记 2023/12/18 3:53:23

【算法集训】基础数据结构：十、矩阵

矩阵其实就是二维数组，这些题目在9日集训中已经做过，这里做的方法大致相同。第一题 1351. 统计有序矩阵中的负数 int countNegatives(int** grid, int gridSize, int* gridColSize) {int r gridSize;int c gridColSize[0];int ret 0;for(int i 0;…...

编程日记 2023/12/18 3:50:19

python排序算法直接插入排序法和折半插入排序法

最近需要使用到一些排序算法，今天主要使针对直接插入排序和折半插入排序进行讲解。首先是直接插入排序，其排序过程主要是，针对A[a1,a2,a3,a4,a5....an]，从排序的序列头部起始位置开始，将其也就是a1视为只有一个元素的…...

编程日记 2023/12/18 3:49:18

【flutter对抗】blutter使用+ACTF习题

最新的能很好反编译flutter程序的项目 1、安装 git clone https://github.com/worawit/blutter --depth1 然后我直接将对应的两个压缩包下载下来（通过浏览器手动下载） 不再通过python的代码来下载，之前一直卡在这个地方。如果读者可以正…...

编程日记 2023/12/18 3:48:17

OpenHarmony 如何去除系统锁屏应用

前言 OpenHarmony源码版本：4.0release / 3.2 release 开发板：DAYU / rk3568 一、3.2版本去除锁屏应用在源码根目录下：productdefine/common/inherit/rich.json 中删除screenlock_mgr组件的编译配置，在rich.json文件中搜索th…...

编程日记 2023/12/18 3:47:16

Python - 搭建 Flask 服务实现图像、视频修复需求

目录一.引言二.服务构建 1.主函数 upload_gif 2.文件接收 3.专属目录 4.图像修复 5.gif2mp4 6.mp42gif 7.图像返回三.服务测试 1.服务启动 2.服务调用四.总结一.引言前面我们介绍了如何使用 Real-ESRGAN 进行图像增强并在原始格式 jpeg、jpg、mp4 的基础上…...

编程日记 2023/12/18 3:45:14

C#基础——构造函数、析构函数

C#基础——构造函数、析构函数 1、构造函数构造函数是一种特殊的方法，用于在创建类的实例时进行初始化操作。构造函数与类同名，并且没有返回类型。构造函数在对象创建时自动调用，可以用来设置对象的初始状态、分配内存、初始化字段等操作…...

编程日记 2023/12/18 3:42:11

jmeter 如何循环使用接口返回的多值？

有同学在用jmeter做接口测试的时候，经常会遇到这样一种情况： 就是一个接口请求返回了多个值，然后下一个接口想循环使用前一个接口的返回值。这种要怎么做呢？ 有一定基础的人，可能第一反应就是先提取前一个接口返回…...

编程日记 2023/12/18 3:41:10

VLAN 详解一（VLAN 基本原理及 VLAN 划分原则）

VLAN 详解一（VLAN 基本原理及 VLAN 划分原则） 在早期的交换网络中，网络中只有 PC、终端和交换机，当某台主机发送一个广播帧或未知单播帧时，该数据帧会被泛洪，甚至传递到整个广播域。而广播域越大&#xff…...

编程日记 2023/12/18 3:40:09

Android - 分区存储 MediaStore、SAF

官方页面参考文章一、概念分区存储（Scoped Storage）的推出是针对 APP 访问外部存储的行为（乱建乱获取文件和文件夹）进行规范和限制，以减少混乱使得用户能更好的控制自己的文件。公有目录被分为两大类：…...

编程日记 2023/12/18 3:38:07

Shiro框架权限控制

首先去通过配置类的用户认证，在用户认证完成后，进行用户授权，用户通过授权之后再跳转其他的界面时，会进行一个验证，当前账号是否有权限。前端权限控制显示的原理在前端中，通常使用用户的角色或权限信息来…...

编程日记 2023/12/18 3:32:00

centOS7 安装tailscale并启用子网路由

1、在centOS7上安装Tailscale客户端 #安装命令所在官网位置：https://tailscale.com/download/linux #具体命令为： curl -fsSL https://tailscale.com/install.sh | sh #命令执行后如下图所示2、设置允许IP转发和IP伪装。安装后，您可以启动…...

编程日记 2023/12/18 3:29:59

1.使用 CrossOrigin 注解作用于controller 方法上示例如下 RestController RequestMapping("/account") public class AccountController {CrossOriginGetMapping("/{id}")public Account retrieve(PathVariable Long id) {// ...}DeleteMapping(&quo…...

编程日记 2023/12/18 3:28:57

importlib --- import 的实现

3.1 新版功能. 源代码 Lib/importlib/__init__.py 概述 importlib 包具有三重目标。一是在 Python 源代码中提供 import 语句的实现（并且因此而扩展 __import__() 函数）。这提供了一个可移植到任何 Python 解释器的 import 实现。与使用 Python 以…...

编程日记 2023/12/18 3:27:56

树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频

使用rpicam-app通过网络流式传输视频使用 rpicam-app 通过网络流式传输视频UDPTCPRTSPlibavGStreamerRTPlibcamerasrc GStreamer 元素文章来源： http://raspberry.dns8844.cn/documentation 原文网址使用 rpicam-app 通过网络流式传输视频本节介绍来自 rpica…...

编程新知 2025/6/15 22:22:18

STM32标准库-DMA直接存储器存取

文章目录一、DMA1.1简介1.2存储器映像1.3DMA框图1.4DMA基本结构1.5DMA请求1.6数据宽度与对齐1.7数据转运DMA1.8ADC扫描模式DMA 二、数据转运DMA2.1接线图2.2代码2.3相关API 一、DMA 1.1简介 DMA（Direct Memory Access）直接存储器存取 DMA可以提供外设…...

编程新知 2025/7/8 8:47:34

华为云Flexus+DeepSeek征文｜DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建

华为云FlexusDeepSeek征文｜DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建前言如今大模型其性能出色，华为云 ModelArts Studio_MaaS大模型即服务平台华为云内置了大模型，能助力我们轻松驾驭 DeepSeek-V3/R1，本文中将分享如何…...

编程新知 2025/7/9 12:47:00

基于 TAPD 进行项目管理

起因自己写了个小工具，仓库用的Github。之前在用markdown进行需求管理，现在随着功能的增加，感觉有点难以管理了，所以用TAPD这个工具进行需求、Bug管理。操作流程注册 TAPD，需要提供一个企业名新建一个项目&#…...

编程新知 2025/6/26 11:27:05

【Redis】笔记｜第8节｜大厂高并发缓存架构实战与优化

缓存架构代码结构代码详情功能点： 多级缓存，先查本地缓存，再查Redis，最后才查数据库热点数据重建逻辑使用分布式锁，二次查询更新缓存采用读写锁提升性能采用Redis的发布订阅机制通知所有实例更新本地缓存适用读多…...

编程新知 2025/7/9 4:52:48

掌握 HTTP 请求：理解 cURL GET 语法

cURL 是一个强大的命令行工具，用于发送 HTTP 请求和与 Web 服务器交互。在 Web 开发和测试中，cURL 经常用于发送 GET 请求来获取服务器资源。本文将详细介绍 cURL GET 请求的语法和使用方法。一、cURL 基本概念 cURL 是 "Client URL" 的缩写…...

编程新知 2025/7/9 20:52:19

医疗AI模型可解释性编程研究：基于SHAP、LIME与Anchor

1 医疗树模型与可解释人工智能基础医疗领域的人工智能应用正迅速从理论研究转向临床实践，在这一过程中，模型可解释性已成为确保AI系统被医疗专业人员接受和信任的关键因素。基于树模型的集成算法（如RandomForest、XGBoost、LightGBM）因其卓越的预测性能和相对良好的解释性…...

编程新知 2025/7/11 5:31:54

2025.6.9总结（利与弊）

凡事都有两面性。在大厂上班也不例外。今天找开发定位问题，从一个接口人不断溯源到另一个接口人。有时候，不知道是谁的责任填。将工作内容分的很细，每个人负责其中的一小块。我清楚的意识到，自己就是个可以随时替换的螺丝钉&…...

编程新知 2025/7/8 21:05:17

OpenGL-什么是软OpenGL/软渲染/软光栅？

‌软OpenGL（Software OpenGL）‌或者软渲染指完全通过CPU模拟实现的OpenGL渲染方式（包括几何处理、光栅化、着色等），不依赖GPU硬件加速。这种模式通常性能较低，但兼容性极强，常用于不支持硬件加速…...

编程新知 2025/7/11 8:22:38

用 FFmpeg 实现 RTMP 推流直播

RTMP（Real-Time Messaging Protocol） 是直播行业中常用的传输协议。一般来说，直播服务商会给你： ✅ 一个 RTMP 推流地址（你推视频上去） ✅ 一个 HLS 或 FLV 拉流地址（观众观看用）…...

编程新知 2025/7/7 14:14:30