当前位置：首页 > news >正文

YOLOv11实时目标检测 | 摄像头视频图片文件检测

news 2026/2/8 18:59:52

在上篇文章中YOLO11环境部署 || 从检测到训练https://blog.csdn.net/2301_79442295/article/details/145414103#comments_36164492，我们详细探讨了YOLO11的部署以及推理训练，但是评论区的观众老爷就说了：“博主博主，你这个只能推理只能推理图片，还要将图片放在文件夹下，有没有更简单方便的推理方法？” 有的兄弟，有的，像这样更简单的方法还有10086个，下面我挑一个用于流式视频文件检测。

摄像头视频图片文件检测

视频文件
图片文件
效果如下
- 视频与摄像头
- 图片文件

视频文件

对于视频或者摄像头等输入，可以将以下代码复制到predict_camera.py运行检测：

from ultralytics import YOLO
import cv2
import torch
from pathlib import Path
import sys
import os
import tkinter as tk
from tkinter import filedialogdef choose_input_source():print("请选择输入来源：")print("[1] 摄像头")print("[2] 视频文件")choice = input("请输入数字 (1 或 2): ").strip()if choice == "1":return 0, "摄像头"elif choice == "2":#选择视频文件root = tk.Tk()root.withdraw()video_path = filedialog.askopenfilename(title="选择视频文件",filetypes=[("视频文件", "*.mp4;*.avi;*.mkv;*.mov"), ("所有文件", "*.*")])if not video_path:print("未选择视频文件，程序退出")sys.exit(0)return video_path, video_pathelse:print("无效的输入，程序退出")sys.exit(1)def detect_media():# ======================= 配置区 =======================# 模型配置model_config = {'model_path': r'E:\git-project\YOLOV11\ultralytics-main\weights\yolo11n.pt',  # 本地模型路径，注意配置！！！！！！！！！！！！！！！！！！！！！！！'download_url': 'https://github.com/ultralytics/assets/releases/download/v8.3.0/yolo11n.pt'  # 如果没有模型文件下载URL}# 推理参数predict_config = {'conf_thres': 0.25,     # 置信度阈值'iou_thres': 0.45,      # IoU阈值'imgsz': 640,           # 输入分辨率'line_width': 2,        # 检测框线宽'device': 'cuda:0' if torch.cuda.is_available() else 'cpu'  # 自动选择设备}# ====================== 配置结束 ======================try:# 选择输入来源input_source, source_desc = choose_input_source()# 初始化视频源cap = cv2.VideoCapture(input_source)if isinstance(input_source, int):# 如果使用摄像头，设置分辨率cap.set(cv2.CAP_PROP_FRAME_WIDTH, 720)cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 720)if not cap.isOpened():raise IOError(f"无法打开视频源 ({source_desc})，请检查设备连接或文件路径。")# 询问是否保存推理出的视频文件save_video = Falsevideo_writer = Noneoutput_path = Noneanswer = input("是否保存推理出的视频文件？(y/n): ").strip().lower()if answer == "y":save_video = True# 创建保存目录：代码文件所在目录下的 predict 文件夹save_dir = os.path.join(os.getcwd(), "predict")os.makedirs(save_dir, exist_ok=True)# 获取视频属性（宽度、高度、fps）frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))fps = cap.get(cv2.CAP_PROP_FPS)if fps == 0 or fps is None:fps = 25  # 如果无法获取fps，设定默认值# 构造输出视频文件路径output_path = os.path.join(save_dir, "output_inference.mp4")fourcc = cv2.VideoWriter_fourcc(*"mp4v")video_writer = cv2.VideoWriter(output_path, fourcc, fps, (frame_width, frame_height))print(f"推理视频将保存至: {output_path}")# 加载模型（带异常捕获）if not Path(model_config['model_path']).exists():if model_config['download_url']:print("开始下载模型...")YOLO(model_config['download_url']).download(model_config['model_path'])else:raise FileNotFoundError(f"模型文件不存在: {model_config['model_path']}")# 初始化模型model = YOLO(model_config['model_path']).to(predict_config['device'])print(f"✅ 模型加载成功 | 设备: {predict_config['device'].upper()}")print(f"输入来源: {source_desc}")# 实时检测循环while True:ret, frame = cap.read()if not ret:print("视频流结束或中断")break# 执行推理results = model.predict(source=frame,stream=True,  # 流式推理verbose=False,conf=predict_config['conf_thres'],iou=predict_config['iou_thres'],imgsz=predict_config['imgsz'],device=predict_config['device'])# 遍历生成器获取结果（取第一个结果）for result in results:annotated_frame = result.plot(line_width=predict_config['line_width'])break# 摄像头模式下显示FPSif isinstance(input_source, int):fps = cap.get(cv2.CAP_PROP_FPS)cv2.putText(annotated_frame, f'FPS: {fps:.2f}', (10, 30),cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)# 显示实时画面cv2.imshow('YOLO Real-time Detection', annotated_frame)# 如保存视频，写入视频文件if save_video and video_writer is not None:video_writer.write(annotated_frame)# 按键退出qif cv2.waitKey(1) & 0xFF == ord('q'):break# 释放资源cap.release()if video_writer is not None:video_writer.release()cv2.destroyAllWindows()print("✅ 检测结束")if save_video and output_path is not None:print(f"推理结果视频已保存至: {output_path}")except Exception as e:print(f"\n❌ 发生错误: {str(e)}")print("问题排查建议：")print("1. 检查视频源是否正确连接或文件路径是否正确")print("2. 确认模型文件路径正确")print("3. 检查CUDA是否可用（如需GPU加速）")print("4. 尝试降低分辨率设置")if __name__ == "__main__":detect_media()

需要更改的参数：
1.model_path：模型文件位置，默认使用的是yolo11n.pt
2.predict_config下置信度等
3.分辨率等
需要注意的是退出按q，点击视频框的×是无法退出的，当然也可以使用Ctrl+C方式退出，退出不会造成摄像头不保存推理文件，文件保存在代码所在文件夹下predict文件夹内。

图片文件

对于图片文件，将图片放在picture文件夹下太麻烦，同样采用选择图片进行检测，同时可以框选多个图片，可以将以下代码复制到predict_images.py运行检测：

from ultralytics import YOLO
import cv2
import torch
from pathlib import Path
import os
import tkinter as tk
from tkinter import filedialogdef choose_input_files():root = tk.Tk()root.withdraw()  # 隐藏主窗口image_paths = filedialog.askopenfilenames(title="选择图片文件",filetypes=[("图片文件", "*.jpg;*.jpeg;*.png;*.bmp;*.tiff;*.gif"), ("所有文件", "*.*")])if not image_paths:print("未选择任何图片文件，程序退出")exit(0)return image_pathsdef detect_images():# ======================= 配置区 =======================# 模型配置model_config = {'model_path': r'E:\git-project\YOLOV11\ultralytics-main\weights\yolo11n.pt',  # 本地模型路径'download_url': 'https://github.com/ultralytics/assets/releases/download/v8.3.0/yolo11n.pt'  # 如果没有模型文件可在此处添加下载URL}# 推理参数predict_config = {'conf_thres': 0.25,     # 置信度阈值'iou_thres': 0.45,      # IoU阈值'imgsz': 640,           # 输入分辨率'line_width': 2,        # 检测框线宽'device': 'cuda:0' if torch.cuda.is_available() else 'cpu'  # 自动选择设备}# ====================== 配置结束 ======================try:# 选择图片文件image_paths = choose_input_files()# 创建保存目录：代码文件所在目录下的 predict 文件夹save_dir = os.path.join(os.getcwd(), "predict", "exp")os.makedirs(save_dir, exist_ok=True)if os.path.exists(save_dir):i = 1while os.path.exists(f"{save_dir}{i}"):i += 1save_dir = f"{save_dir}{i}"os.makedirs(save_dir)# 加载模型（带异常捕获）if not Path(model_config['model_path']).exists():if model_config['download_url']:print("开始下载模型...")YOLO(model_config['download_url']).download(model_config['model_path'])else:raise FileNotFoundError(f"模型文件不存在: {model_config['model_path']}")# 初始化模型model = YOLO(model_config['model_path']).to(predict_config['device'])print(f"✅ 模型加载成功 | 设备: {predict_config['device'].upper()}")# 处理每个选定的图片文件for image_path in image_paths:print(f"正在处理图片: {image_path}")img = cv2.imread(image_path)if img is None:print(f"无法读取图片: {image_path}")continue# 执行推理results = model.predict(source=img,  # 输入图片stream=False,  # 禁用流模式verbose=False,conf=predict_config['conf_thres'],iou=predict_config['iou_thres'],imgsz=predict_config['imgsz'],device=predict_config['device'])# 解析并绘制结果（取第一个结果）for result in results:annotated_img = result.plot(line_width=predict_config['line_width'])break# 保存推理结果图像到文件output_image_path = os.path.join(save_dir, f"output_{os.path.basename(image_path)}")cv2.imwrite(output_image_path, annotated_img)print(f"推理结果已保存至: {output_image_path}")# 显示实时画面，取消下面注释就会边检测边弹出结果# cv2.imshow('YOLO Real-time Detection', annotated_img)# 等待按键退出当前图片查看if cv2.waitKey(0) & 0xFF == ord('q') :breakcv2.destroyAllWindows()print("✅ 检测结束")except Exception as e:print(f"\n❌ 发生错误: {str(e)}")print("问题排查建议：")print("1. 检查图片文件路径是否正确")print("2. 确认模型文件路径正确")print("3. 检查CUDA是否可用（如需GPU加速）")print("4. 尝试降低分辨率设置")if __name__ == "__main__":detect_images()

同样需要更改模型文件地址、置信度等，图片文件保存在代码文件夹的predict文件夹下exp中，如果想要检测时就查看图片，可以将这段代码取消注释：

            # 显示实时画面cv2.imshow('YOLO Real-time Detection', annotated_img)

效果如下

视频与摄像头

在这里插入图片描述

图片文件

在这里插入图片描述

所有推理出的文件都会在代码同级的predict目录下，按q退出。

YOLOv11实时目标检测 | 摄像头视频图片文件检测

在上篇文章中YOLO11环境部署 || 从检测到训练https://blog.csdn.net/2301_79442295/article/details/145414103#comments_36164492，我们详细探讨了YOLO11的部署以及推理训练，但是评论区的观众老爷就说了：“博主博主，你这个只能推理…...

编程日记 2025/2/6 11:00:54

Node.js学习指南

一、模块化规范 nodejs使用的模块化规范叫做 common.js 规范: 每一个模块都有独立的作用域代码在各自模块中执行不会造成全局污染每一个模块都是一个独立的文件（module对象） 模块可以被多次加载（module.exports 属性） 但是仅…...

编程日记 2025/2/6 10:58:52

2.5学习总结

今天看了二叉树，看的一脸懵，写了两道题 P4913：二叉树深度 #include <stdio.h> #include <stdlib.h> struct hly {int left;int right; }tree[1000005]; int hulingyun(int x) {if(x0)return 0;return 1max(hulingyun(tree[x].le…...

编程日记 2025/2/6 10:55:48

java进阶文章链接

java 泛型：java 泛型详解-绝对是对泛型方法讲解最详细的，没有之一 Java 泛型，你了解类型擦除吗？ java 注解：深入理解Java注解类型秒懂，Java 注解 （Annotation）你可以这样学 jav…...

编程日记 2025/2/6 10:52:45

vue2+vue3 HMCXY基础入门

vue2vue3 HMCXY基础入门一、Vue2.x技术精讲1.Vue快速上手（1）Vue概念（2）创建实例（3）插值表达式（4）响应式特性（5）开发者工具 2.Vue指令二、Vue3.x技术精讲一、…...

编程日记 2025/2/6 10:48:41

一次线程数超限导致的hive写入hbase作业失败分析

1.集群配置操作系统：SuSe操作系统集群节点：100台相同配置的服务器单台：核心112Core，内存396G 2.问题现象现象1：跑单个入库任务报错，批量提交任务后出现OOM异常执行12个hivesql,将数据写入hbase.hbase入库有近一半的任务报错。每次报错的任务不是同一个，hivesql…...

编程日记 2025/2/6 10:47:38

ip属地是手机号还是手机位置？一文理清

在数字化和网络化的今天，IP属地这一概念逐渐成为了人们关注的焦点。特别是在社交媒体和在线平台上，IP属地的显示往往让人联想到用户的地理位置。然而，关于IP属地到底与手机号还是手机位置有关，却存在着不少误解和混淆。本文将深入…...

编程日记 2025/2/6 10:45:36

查看设备uuid

在大多数操作系统中，可以通过不同的方式来查看设备的 UUID（Universally Unique Identifier）。以下是一些常见的方法： 在Linux系统中，可以使用命令行工具blkid或lsblk来查看设备的 UUID。例如，执行以下命令…...

编程日记 2025/2/6 10:43:34

C_C++输入输出（下）

C_C输入输出（下） 用两次循环的问题： 1.一次循环决定打印几行，一次循环决定打印几项 cin是>> cout是<< 字典序是根据字符在字母表中的顺序来比较和排列字符串的（字典序的大小就是字符串的大小）…...

编程日记 2025/2/6 10:41:32

All in one 的 AI tool Chain “Halomate”

这不算广告啊，就是真好用，虽然是我哥们儿的产品比如你定了个gpt的plus 订阅，你发现好像有挺多功能 1- chat，这个自不必说，必须的功能 2- 高级语音现在变成学英语的了，实时视频也就是我过年给姑婶介绍是…...

编程日记 2025/2/6 10:40:31

crewai框架第三方API使用官方RAG工具(pdf，csv，json)

最近在研究调用官方的工具，但官方文档的说明是在是太少了，后来在一个视频里看到了如何配置，记录一下以PDF RAG Search工具举例，官方文档对于自定义模型的说明如下： 默认情况下，该工具使用 OpenAI 进行嵌…...

编程日记 2025/2/6 10:38:28

脉冲信号傅里叶变换与频域分析：从计算到理解

摘要本文聚焦于脉冲信号的傅里叶变换，详细推导了矩形脉冲信号和单边指数信号的傅里叶变换过程，深入解释了傅里叶变换结果 F ( ω ) F(\omega) F(ω) 的内涵，包括其定义、物理意义、包含的信息以及在实际应用中的重要性。旨在帮助读者全面掌…...

编程日记 2025/2/6 10:37:27

6.【BUUCTF】[SUCTF 2019]CheckIn

打开题目页面如下看样子是一道有关文件上传的题上传一句话木马显示：非法后缀！ 看来.php后缀被过滤了上传一张带有木马的照片在文件地址处输入cmd 输入以下代码执行 copy 1.jpg/b4.php/a 5.jpg 最后一行有一句话木马上传带有木马的图片但其实…...

编程日记 2025/2/6 10:36:25

基于springboot的体质测试数据分析及可视化设计

作者：学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等文末获取“源码数据库万字文档PPT”，支持远程部署调试、运行安装。项目包含： 完整源码数据库功能演示视频万字文档PPT 项目编码&#xff1…...

编程日记 2025/2/6 10:33:22

孟加拉国_行政边界省市边界arcgis数据shp格式wgs84坐标

这篇内容将深入探讨孟加拉国的行政边界省市边界数据，该数据是以arcgis的shp格式提供的，并采用WGS84坐标系统。ArcGIS是一款广泛应用于地理信息系统（GIS）的专业软件，它允许用户处理、分析和展示地理空间数据。在GIS领域…...

编程日记 2025/2/6 10:30:19

目录内参外参转换可视化相机pose colmap形式的相机内参外参内参外参转换 def visualize_cameras(cameras, images):fig plt.figure()ax fig.add_subplot(111, projection3d)for image_id, image_data in images.items():qvec image_data[qvec]tvec image_data[tvec]#…...

编程日记 2025/2/6 10:29:18

数据结构树2

文章目录前言一，二叉搜索树的高度二，广度优先VS深度优先三，广度优先的代码实现四，深度优先代码实现五，判断是否为二叉搜索树六，删除一个节点七，二叉收索树的中序后续节点总结 …...

编程日记 2025/2/6 10:26:14

GB/T 44721-2024 与 L3 自动驾驶：自动驾驶新时代的基石与指引

1.前言在智能网联汽车飞速发展的当下，自动驾驶技术成为了行业变革的核心驱动力。从最初的辅助驾驶功能，到如今不断迈向高度自动化的征程，每一步都凝聚着技术的创新与突破。而在这一进程中，标准的制定与完善对于自动驾驶技术的规…...

编程日记 2025/2/6 10:24:09

AURIX TC275学习笔记3 官方例程 (UART LED WDT)

文章目录参考资料1. ASCLIN_UART_12. GPIO_LED_Button_13. WDT (Watch Dog Timer) 参考资料 AURIX TC275学习笔记1 资料收集Getting Started with AURIX™ Development Studio 官方帮助文档happy hacking for TC275! 硬件平台使用AURIX™ TC275 Lite 套件，按照参…...

编程日记 2025/2/6 10:22:06

Vim的基础命令

移动光标 H(左) J(上) K(下) L(右) $ 表示移动到光标所在行的行尾， ^ 表示移动到光标所在行的行首的第一个非空白字符。 0 表示移动到光标所在行的行首。 W 光标向前跳转一个单词 w光标向前跳转一个单词 B光标向后跳转一个单词 b光标向后跳转一个单词 G 移动光标到…...

编程日记 2025/2/6 10:18:01

浅谈 React Hooks

React Hooks 是 React 16.8 引入的一组 API，用于在函数组件中使用 state 和其他 React 特性（例如生命周期方法、context 等）。Hooks 通过简洁的函数接口，解决了状态与 UI 的高度解耦，通过函数式编程范式实现更灵活 Rea…...

编程新知 2025/9/23 15:13:40

关于nvm与node.js

1 安装nvm 安装过程中手动修改 nvm的安装路径， 以及修改通过nvm安装node后正在使用的node的存放目录【这句话可能难以理解，但接着往下看你就了然了】 2 修改nvm中settings.txt文件配置 nvm安装成功后，通常在该文件中会出现以下配置&…...

编程新知 2026/1/28 15:17:32

如何将联系人从 iPhone 转移到 Android

从 iPhone 换到 Android 手机时，你可能需要保留重要的数据，例如通讯录。好在，将通讯录从 iPhone 转移到 Android 手机非常简单，你可以从本文中学习 6 种可靠的方法，确保随时保持连接，不错过任何信息。第 1…...

编程新知 2026/1/31 5:09:27

ElasticSearch搜索引擎之倒排索引及其底层算法

文章目录一、搜索引擎1、什么是搜索引擎？2、搜索引擎的分类3、常用的搜索引擎4、搜索引擎的特点二、倒排索引1、简介2、为什么倒排索引不用B+树1.创建时间长，文件大。2.其次，树深，IO次数可怕。3.索引可能会失效。4.精准度差。三. 倒排索引四、算法1、Term Index的算法2、 …...

编程新知 2026/1/30 17:10:19

Linux-07 ubuntu 的 chrome 启动不了

文章目录问题原因解决步骤一、卸载旧版chrome二、重新安装chorme三、启动不了，报错如下四、启动不了，解决如下总结问题原因在应用中可以看到chrome，但是打不开(说明：原来的ubuntu系统出问题了，这个是备用的硬盘&a…...

编程新知 2026/1/29 17:56:19

【OSG学习笔记】Day 16: 骨骼动画与蒙皮（osgAnimation）

骨骼动画基础骨骼动画是 3D 计算机图形中常用的技术，它通过以下两个主要组件实现角色动画。骨骼系统 (Skeleton)：由层级结构的骨头组成，类似于人体骨骼蒙皮 (Mesh Skinning)：将模型网格顶点绑定到骨骼上，使骨骼移动…...

编程新知 2026/2/1 5:42:50

计算机基础知识解析：从应用到架构的全面拆解

目录前言 1、计算机的应用领域：无处不在的数字助手 2、计算机的进化史：从算盘到量子计算 3、计算机的分类：不止 “台式机和笔记本” 4、计算机的组件：硬件与软件的协同 4.1 硬件：五大核心部件 4.2 软件&#…...

编程新知 2026/1/31 9:44:27

毫米波雷达基础理论（3D+4D）

3D、4D毫米波雷达基础知识及厂商选型 PreView : https://mp.weixin.qq.com/s/bQkju4r6med7I3TBGJI_bQ 1. FMCW毫米波雷达基础知识主要参考博文： 一文入门汽车毫米波雷达基本原理 ：https://mp.weixin.qq.com/s/_EN7A5lKcz2Eh8dLnjE19w 毫米波雷达基础…...

编程新知 2026/1/31 14:20:10

Kubernetes 网络模型深度解析：Pod IP 与 Service 的负载均衡机制，Service到底是什么？

Pod IP 的本质与特性 Pod IP 的定位纯端点地址：Pod IP 是分配给 Pod 网络命名空间的真实 IP 地址（如 10.244.1.2）无特殊名称：在 Kubernetes 中，它通常被称为 “Pod IP” 或 “容器 IP”生命周期：与 Pod …...

编程新知 2025/11/4 22:48:45

STL 2迭代器

文章目录 1.迭代器2.输入迭代器3.输出迭代器1.插入迭代器 4.前向迭代器5.双向迭代器6.随机访问迭代器7.不同容器返回的迭代器类型1.输入 / 输出迭代器2.前向迭代器3.双向迭代器4.随机访问迭代器5.特殊迭代器适配器6.为什么 unordered_set 只提供前向迭代器？ 1.迭代器…...

编程新知 2025/10/2 23:42:13

摄像头视频图片文件检测

视频文件

图片文件

效果如下

视频与摄像头

图片文件

相关文章：