目标检测应用场景和发展趋势
参考:
目标检测的未来是什么? - 知乎 (zhihu.com)https://www.zhihu.com/question/394900756/answer/32489649815大应用场景
1 行人检测:
- 遮挡问题:行人之间的互动和遮挡是非常常见的,这给行人检测带来了挑战。
- 非刚性目标:行人是非刚性目标,其运动非常灵活。在复杂交通环境下,行人的行为具有很大的随机性和任意性。
- 多姿势变化问题:行人可能有多种行走姿态,而且可能会与背景混合,难以分离。
- 检测场景的复杂性:例如光照度的变化、时变性和大量存在的类似行人部分轮廓的物体等因素的干扰。
- 行人检测的准确性和实时性:如何准确地检测和跟踪行人是行人检测技术需要解决的关键问题。
2 人脸检测
- 人脸姿态和饰物问题:由于非配合型监控,人脸会出现侧脸、低头、抬头等各种姿态,以及佩戴帽子、黑框眼镜、口罩等饰物现象。
- 光照问题:由于环境光源的影响,可能出现侧光、顶光、背光和高光等现象。
- 人脸相似性问题:不同个体之间特别是同一民族的区别不大,所有人脸的结构都相似,甚至人脸的结构外形都很相似。
- 人脸易变性:人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大。
- 人脸表情复杂:人脸具有多样的变化能力,人的脸上分布着五十多块面部肌肉,这些肌肉的运动导致不同面部表情的出现,会造成人脸特征的显著改变。
- 人脸随年龄而改变:随着年龄的增长,皱纹的出现和面部肌肉的松弛使得人脸的结构和纹理都将发生改变。
- 人脸有易变化的附加物:例如改变发型,蓄留胡须或者佩戴帽子和眼镜等饰物。
- 人脸特征遮掩:人脸全部、部分遮掩将会造成错误识别。
- 人脸图像畸变:由于光照、视角、摄取角度不同,可能会造成图像的灰度畸变、角度旋转等,降低了图像质量,增大了识别难度。
3 文本检测
- 文本具有多样性:自然场景中的文本检测难点主要在于文本的多样性,包括文字颜色、大小、字体、形状、方向、语言、以及文本长度的影响。
- 文本形状复杂多样:文本的形状也是一大难点,因为文本可以以各种不同的形式出现在图像或视频中,包括单个字符的位置或者整个文本行的位置。
- 缺乏通用方法:当前所说的文本检测一般是自然场景文本检测,其难点在于缺乏一个通用的方法来解决所有问题。
- 背景复杂:在图像或视频中,文本可能会出现在各种不同的背景中,这增加了检测的难度。
- 光照条件不定:光照的变化也会对文本检测造成很大的影响。
- 文本大小不一:文本的大小也是一大难点,因为文本的大小会因图像或视频的分辨率不同而变化。
- 字符粘连和断字:在某些情况下,文本中的字符可能会相互粘连,或者字符可能会断开,这会增加检测的难度。
- 字体和字库大小有限:不同的字体和字库大小也会影响文本检测的结果。
- 文本倾斜:文本可能会以不同的角度倾斜出现在图像或视频中,这也会增加检测的难度。
- 遮挡和背景扰动:文本可能会被其他物体遮挡,或者背景中存在扰动因素,这也会影响文本检测的结果。
4 交通信号检测
- 复杂的背景环境:在实际的城市自动驾驶场景中采集的交通信号灯图像具有复杂的背景,如四面八方的信号灯以及其他各类发光源。 遮挡问题:例如前面行驶的大货车或是交通指示牌等,都可能导致交通信号灯被遮挡。
- 多态性的问题:交通信号灯不仅有颜色、形状和位置的变化,一些交通灯还包括箭头来指示方向和标记,比如人或自行车。
- 成像条件的影响:包括天气、低分辨率、模糊等因素的影响,这些因素都可能降低交通信号灯检测的准确性。
- 特征提取和分类问题:对交通信号灯进行识别通常来说分为两个过程,第一步是对图像的候选区域进行特征提取,第二步就是根据特征对识别的特征进行分类。
5 遥感目标检测
- 数据规模问题:由于遥感图像的数据规模相对较小,这可能会对模型的训练产生影响。
- 目标尺寸问题:遥感图像中包含了大量小尺寸的目标,这些小目标在经过神经网络的多层处理后,细节信息可能会丢失过多,导致检测准确率下降。
- 旋转目标的检测问题:这是遥感图像目标检测中的一个重要难题,因为一般的检测算法往往假设目标在图像中是固定方向和姿态的,而旋转目标的出现会大大增加检测的难度。
- 大中小目标分布不均:遥感场景下进行旋转目标检测时,大、中、小目标的分布通常是不均匀的,这种分布的不均衡性也增加了检测的难度。
- 计算资源限制:相比于自然图像数据集,航拍图像一般分辨率较高,受计算资源限制,一些在自然图像中有效的检测小目标的方法如FPN直接应用到航拍图像就无能为力了。
- 遥感图像分辨率巨大:遥感图像分辨率巨大,因此如何快速准确地检测出遥感目标仍然是一个挑战性的问题。
- 目标遮挡问题:超过50%的目标被云雾所遮挡,因此目标遮挡问题也是遥感图像目标检测所面临的一个挑战。
- 域适应问题:由不同传感器所捕获的遥感图像仍然存在很大差异。
7大发展趋势
1 轻量型目标检测
轻量型目标检测的难点主要集中在以下几个方面:
- 小模型性能问题:由于模型容量和能力的限制,小模型往往难以达到较好的性能。虽然大型模型的性能较好,但速度较慢,不符合实时需求。
- 精确度与模型压缩之间的差距:在模型压缩过程中,可能会出现精确度下降的问题。物体检测比分类要困难得多,例如标签的计算更加昂贵,类别不均衡,多任务同时需要分类和回归等。
- 数据不平衡问题:在轻量级目标检测中,正负样本比例失衡是一个常见问题,这会导致模型过于关注多数类,而忽视少数类,从而影响检测的准确性。
- 计算资源限制:轻量型目标检测需要在有限的计算资源上进行,如何在保证准确性的同时提高检测速度是一个重要的挑战。
- 模型加速与优化:如何设计并优化轻量化网络结构以提高模型的速度和准确度是一个重要的研究方向。
2 与AutoML结合的目标检测
3 领域自适应的目标检测
4 弱监督目标检测
5 小目标检测
- 可利用特征较少:小目标相比于大/中目标分辨率低,信息较少,难以提取到具有鉴别力的特征。
- 定位精度要求高:小目标在图像中位置过小且极易受到环境干扰,网络预测时偏移一个像素则对小目标的影响是巨大的。
- 现有数据集中小目标占比少:现有数据集较少关注小目标这一特别类型。同时,小目标不易标注,人力成本巨大,而且对误差更为敏感。
- 样本不均衡:训练时通过设定阈值来判断锚框是否属于正样本,这样会导致不同尺寸目标的样本不均衡问题。因此,当人工设定的锚框与真实边框相差较大时,会导致模型忽略小目标的检测。
- 小目标聚集:小目标更容易出现聚集的现象,这时网络模型的预测边框可能会因非极大值抑制过滤掉大量正确边框,导致漏掉小目标,或是边框距离过近,导致模型难以收敛。
6 视频检测
- 图像模糊:在拍摄视频的过程中,由于物体或相机的移动,会造成视频中的某些帧的画面发生模糊,造成无法分辨目标的情况。
- 目标遮挡:如果目标物体被其他物体遮挡,会使目标检测更加困难。在这种情况下,需要算法能够识别并分割出被遮挡的目标。
- 区分相似目标:在图像中,可能存在与目标物体外形相似的非目标物体,如何区分它们是一个难题。
- 保持视频中目标的时空一致性:由于视频比静态图像多了一个时间维度上的信息,所以大多数视频目标检测算法利用该信息来增强检测性能,最常见的思路就是使用其他帧的特征来增强关键帧的预测效果。
- 夜间诊断效果不佳:由于夜间为黑白画面呈现,加上夜间灯光的影响,视频诊断系统很难对画面问题做出准确判断。
-
上下文信息利用:由于视频相较于单张图片多了一个时间维度上的信息,因此如何有效地利用这些时间上下文信息来提高检测性能,是视频检测面临的一个重要问题。
-
运动变化处理:视频中的目标检测需要在静态图像目标检测的基础上对目标因运动产生的各种变化进行处理。
7 信息融合目标检测
相关文章:
![](https://csdnimg.cn/release/blog_editor_html/release2.3.6/ckeditor/plugins/CsdnLink/icons/icon-default.png?t=N7T8)
目标检测应用场景和发展趋势
参考: 目标检测的未来是什么? - 知乎 (zhihu.com)https://www.zhihu.com/question/394900756/answer/32489649815大应用场景 1 行人检测: 遮挡问题:行人之间的互动和遮挡是非常常见的,这给行人检测带来了挑战。非刚性…...
![](https://img-blog.csdnimg.cn/10a732497f8c41c1b4f1c7a12e2c4928.png)
Confluence 自定义博文列表
1. 概述 Confluence 自有博文列表无法实现列表自定义功能,实现该需求可采用页面中引用博文宏标签控制的方式 2. 实现方式 功能入口: Confluence →指定空间→创建页面 功能说明: (1)页面引用博文宏 (…...
![](https://www.ngui.cc/images/no-images.jpg)
chrome历史版本下载
chrome历史版本下载 windows Google Chrome all versions on Windows linux版本 Google Chrome 64bit Linux版_chrome浏览器,chrome插件,谷歌浏览器下载,谈笑有鸿儒...
![](https://img-blog.csdnimg.cn/8b00e18ad5c843e29c28c24df7c95771.png)
Messari发布Moonbeam简报,每日交易量稳步增长,首次公布利润数据
区块链数据公司Messari首次发布Moonbeam项目分析简报,从项目市值、链上数据表现、质押以及Moonbeam的技术优势XCM使用量等角度全面分析。这个再熊市初期上线的项目一直在默默开发,并在跨链互操作领域拥有了相当的实操成绩。我们翻译了Messari简报中的部分…...
![](https://www.ngui.cc/images/no-images.jpg)
数据库 锁、索引、在实际开发中怎么设置和优化
数据库锁和索引是数据库管理的两个重要方面,它们对于确保数据的一致性和提高查询性能具有重要作用。在实际开发中,正确地设置和优化锁和索引对于构建高效、稳定的系统至关重要。下面是一些关于如何在实际开发中设置和优化锁和索引的建议: 锁…...
![](https://img-blog.csdnimg.cn/02edf8b4acd44cd9a587b5ee9b7cb815.png)
超详细彻底卸载Anaconda详细教程
一、在开始处打开Anaconda Prompt 二、打开后,输入conda install tqdm -f命令并按回车键 conda install tqdm -f三、之后页面会出现一个WANNING,这个我们不用在意,然后会出现一个y/n提示框,在这里我们输入y或者Y y四、输入cond…...
![](https://img-blog.csdnimg.cn/9f92f022b4cf477da1591fbe4bc1c16c.png)
Python--随机出拳(random)--if判断--综合案例练习:石头剪刀布
注:涉及相关链接: Python:if判断--综合案例练习:石头剪刀布-CSDN博客 Python语言非常的强大,强大之处就在于其拥有很多模块(module),这些模块中拥有很多别人已经开发好的代码&…...
![](https://img-blog.csdnimg.cn/4f6fa3baa31d4614a5f7c70a0d8a3e90.png#pic_center)
微信小程序里配置less
介绍 在微信小程序里,样式文件的后缀名都是wxss,这导致一个问题,就是页面样式过多的时候,要写很多的类名来包裹,加大了工作量,还很有可能会写错样式。这时可以配置一个less,会大大提高代码编辑…...
![](https://img-blog.csdnimg.cn/c497beba1d534d1787e7a86234101c22.png)
MySq修改配置文件
要修改 MySQL 的配置文件,您可以按照以下步骤进行操作: 1、打开 MySQL 的配置文件 在大多数 Linux 系统上,默认的配置文件路径是 /etc/my.cnf 或 /etc/mysql/my.cnf。您可以使用文本编辑器(如 vim、nano)以管理员权限打开该文件。 sudo vim /etc/my.cnf 2、进行修改 …...
![](https://img-blog.csdnimg.cn/img_convert/09ae50018b11e4b3b93f2ad1a68ff667.png)
HTML 表格及练习
表格 概述 表格是一种二维结构,横行纵列。 由单元格组成。 表格是一种非常“强” 的结构: 每一行有相同的列数(单元格),每一列有相同的行数(单元格) 同一列的单元格,宽度&#…...
![](https://img-blog.csdnimg.cn/269419325a2842499a6e556a381539a3.png)
YOLOv5-训练自己的VOC格式数据集(VOC、自建数据集)
YOLOv5:训练自己的 VOC 格式数据集 1. 自定义数据集 1.1 环境安装 pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple注意: 安装 lxmlPillow 版本要低于 10.0.0,解释链接: module ‘PIL.Image’ has no attri…...
![](https://img-blog.csdnimg.cn/img_convert/2527d61704efc8268a906e7ba8ee91e6.png)
基于Java的考研信息查询系统设计与实现(源码+lw+部署文档+讲解等)
文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding) 代码参考数据库参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者&am…...
![](https://img-blog.csdnimg.cn/bc3e48136871431dbf7a00be11105095.png)
Linux性能优化--性能追踪:受CPU限制的应用程序(GIMP)
10.0 概述 本章包含了一个例子:如何用Linux性能工具在受CPU限制的应用程序中寻找并修复性能问题。 阅读本章后,你将能够: 在受CPU限制的应用程序中明确所有的CPU被哪些源代码行使用。用1trace和oprofile弄清楚应用程序调用各种内部与外部函…...
![](https://img-blog.csdnimg.cn/4a361137a39c4b24b7c2937916b5d5c7.png)
BERT变体(1):ALBERT、RoBERTa、ELECTRA、SpanBERT
Author:龙箬 Computer Application Technology Change the World with Data and Artificial Intelligence ! CSDNweixin_43975035 *天下之大,虽离家万里,何处不可往!何事不可为! 1. ALBERT \qquad ALBERT的英文全称为A Lite versi…...
![](https://img-blog.csdnimg.cn/5ccb534fc4af497b804497715484bce5.png)
域控操作二:设置域用户使用简单密码
过程太多简单 直接写出路径更改即可 组策略—计算机配置----策略—Windows设置–安全设置----账户策略–密码策略 按自己想法改就行了 注意一点!!!!! 要么自己设置策略,要么从默认策略改!&am…...
![](https://img-blog.csdnimg.cn/0f7ad3b07b9348aea5c01d08d92cd986.png)
python---三目运算符
在Python中三目运算符也叫三元运算符,其主要作用:就是用于 简化if...else...语句。 基本语法: 原 if 条件判断: # 语句段1 else: # 语句段2 新-----三目运算符/三元运算符 语句段1 if 条件判断 else 语句段2 案例 输入两个数…...
![](https://www.ngui.cc/images/no-images.jpg)
百度地图定位BMap.GeolocationControl的用法
BMap.GeolocationControl 是百度地图API中的一个类,用于添加地理定位控件到地图上,以便用户可以通过该控件获取自己的当前位置。以下是 BMap.GeolocationControl 的用法示例: 首先,确保已经加载了百度地图API,并且创建…...
![](https://img-blog.csdnimg.cn/535bccce07be45bb83532f26ac22c61e.png)
Vue3响应式原理初探
vue3响应式原理初探 为什么要使用proxy取代defineProperty使用proxy如何完成依赖收集呢? 为什么要使用proxy取代defineProperty 原因1:defineproperty无法检测到原本不存在的属性。打个🌰 new Vue({data(){return {name:wxs,age:25}}})在vue…...
![](https://img-blog.csdnimg.cn/img_convert/4f4a37799ae9a3bbe563403fea709218.webp?x-oss-process=image/format,png)
firewalld常用的基础配置
firewalld防火墙是centos7系统默认的防火墙管理工具,取代了之前的iptables防火墙,也是工作在网络层,属于包过滤防火墙。 支持IPv4、IPv6防火墙设置以及以太网桥支持服务或应用程序直接添加防火墙规则接口拥有两种配置模式:临时模…...
![](https://img-blog.csdnimg.cn/img_convert/09d4fed4559a63584a9281d18ded21e3.jpeg)
功率放大器如何驱动超声波换能器
驱动超声波换能器的功率放大器在超声波应用中起着至关重要的作用。它能够提供足够的功率和精确的信号控制,使换能器能够有效地将电能转换为超声波能量。下面安泰电子将介绍功率放大器如何驱动超声波换能器的原理和关键要点。 首先,让我们了解一下超声波换…...
![](https://img-blog.csdnimg.cn/be77f68aaea840179706a492ce4ca86d.png)
LiveGBS流媒体平台GB/T28181常见问题-安全控制HTTP接口鉴权勾选流地址鉴权后401Unauthorized如何播放调用接口
LiveGBS流媒体平台GB/T28181常见问题-安全控制HTTP接口鉴权勾选流地址鉴权后401 Unauthorized如何播放调用接口? 1、安全控制1.1、HTTP接口鉴权1.2、流地址鉴权 2、401 Unauthorized2.1、携带token调用接口2.1.1、获取鉴权token2.1.2、调用其它接口2.1.2.1、携带 Co…...
![](https://img-blog.csdnimg.cn/82cc16f306c345d7a3a2ff286a57fa37.png)
红帽认证笔记2
文章目录 1.配置系统以使用默认存储库1.调试selinux2.创建用户账户3.配置cron4. 创建写作目录5. 配置NTP6.配置autofs配置文件权限容器解法1.修改journal配置文件2.重启服务3.拷贝文件到指定目录4.修改拥有人所属组5.修改umask6.切换elovodo用户7.登录容器仓库8.拉取镜像9.运行…...
![](https://www.ngui.cc/images/no-images.jpg)
程序开发中表示密码时使用 password 还是 passcode?
password 和 passcode 是两个经常在计算机和网络安全中使用的术语,两者都是用于身份验证的机制,但它们之间还是存在一些区别的。 password password 通常是指用户自己设置的一串字符,用于保护自己的账户安全。密码通常是静态的,…...
![](https://www.ngui.cc/images/no-images.jpg)
html5 文字自动省略,html中把多余文字转化为省略号的实现方法方法
单行文本: .box{width: 200px;background-color: aqua;text-overflow: ellipsis;overflow: hidden;white-space: nowrap; }多行文本 1.利用-webkit-line-clamp属性 .box{width: 200px;overflow : hidden;text-overflow: ellipsis;display: -webkit-box;-webkit-l…...
![](https://img-blog.csdnimg.cn/1d8711d0c85c41c8bb0e4bcaaba94379.png)
6.SNMP报错-Error opening specified endpoint “udp6:[::1]:161“处理
启动SNMP服务 /etc/init.d/snmpd start 出现以下报错信息 [....] Starting snmpd (via systemctl): snmpd.serviceJob for snmpd.service failed because the control process exited with error code. See "systemctl status snmpd.service" and "journalctl…...
![](https://img-blog.csdnimg.cn/img_convert/76357db66c06e80aa7f8ec94c1e957e6.png)
集合的进阶
不可变集合 创建不可变的集合 在创建了之后集合的长度内容都不可以变化 静态集合的创建在list ,set ,map接口当中都可以获取不可变集合 方法名称说明static list of(E …elements)创建一个具有指定元素集合list集合对象staticlist of(E…elements)创…...
![](https://img-blog.csdnimg.cn/956bd04a548b4ba5a7e90f787282efd2.gif#pic_center)
【LeetCode刷题(数据结构与算法)】:数据结构中的常用排序实现数组的升序排列
现在我先将各大排序的动图和思路以及代码呈现给大家 插入排序 直接插入排序是一种简单的插入排序法,其基本思想是: 把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为 止,得到一个…...
![](https://img-blog.csdnimg.cn/6c153f676f594765bb539215ef043af9.png)
【HTML+CSS】零碎知识点
公告滚动条 <!DOCTYPE html> <html><head><title>动态粘性导航栏</title><style>.container {background: #00aeec;overflow: hidden;padding: 20px 0;}.title {float: left;font-size: 20px;font-weight: normal;margin: 0;margin-left:…...
![](https://img-blog.csdnimg.cn/62de859db1d64e5fb6f1729229d770cd.png)
嵌入式开发学习之STM32F407串口(USART)收发数据(三)
嵌入式开发学习之STM32F407串口(USART)收发数据(三) 开发涉及工具一、选定所使用的串口二、配置串口1.配置串口的I/O2.配置串口参数属性3.配置串口中断4.串口中断在哪里处理5.串口如何发送字符串 三、封装串口配置库文件1.创建头文…...
![](https://img-blog.csdnimg.cn/41110d9823c8426d9d31f416a4b7ed0a.png)
python:talib.BBANDS 画股价-布林线图
python 安装使用 TA_lib 安装主要在 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 这个网站找到 TA_Lib-0.4.24-cp310-cp310-win_amd64.whl pip install /pypi/TA_Lib-0.4.24-cp310-cp310-win_amd64.whl 编写 talib_boll.py 如下 # -*- coding: utf-8 -*- import os impor…...
做网站的销售员电话话术/应用商店app下载
intro为什么需要link呢linker主要做了哪些工作呢目标文件ELF Symbol Link链接器变量Symbol ResolutionLocal SymbolLinker Symbol Rule Relocation Packaging Libstatic libariesDynamic liblib interpositioning 转载请注明出处:http://blog.csdn.net/c602273091/…...
![](https://images2017.cnblogs.com/blog/1200609/201709/1200609-20170930101240153-1705337645.jpg)
中国建设银行网站/b站推广
1. plot()函数的使用 plot()函数的使用 plot(x,y,format_string,**kwargs) x:x轴数据,列表或数组,可选 y:y轴数据,列表或数组 format_string :控制曲线的格式字符串,可选由颜色字符,…...
![](/images/no-images.jpg)
3dmax做动画的网站有哪些/爱站长工具
天线长度一般 = 波长1/4效果最好 114dB 300M, 114dB 感度 功率 每减小6DB,传输距离减小一倍 转载于:https://www.cnblogs.com/ldcb/p/8032944.html...
![](https://img-blog.csdnimg.cn/20210129144639924.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0NFQ0JD,size_16,color_FFFFFF,t_70#pic_center)
各大网站的名字大全/上海网站关键词排名
革命正在如火如荼地进行,并有望挑战传统金融,但除DeFi之外,还有哪些有前途的场景会有助于区块链被主流社会接受? 本文阐述了四种有可能被主流消费者理解和使用区块链的场景。 场景一:边做边赚 谁不想用自己的时间、知…...
![](https://img-blog.csdnimg.cn/e3d4e738a6ec4809b415037e3e25cd90.jpeg#pic_center)
石景山区城乡建设委员会网站/百度网站是什么
好消息: 近日,拉勾招聘数据研究院对程序员群体开展深度调研后,发布了一份《2022程序员群体职场洞察报告》(以下简称报告),对当下程序员群体职场生存状态、薪资水平和职场选择等方面给出了数据参考。 近8成…...
![](/images/no-images.jpg)
wordpress手机号码插件/百度推广有哪些售后服务
我们的家庭宽带光猫软件会定期进行升级,推送及更新一些新的插件,下面来说说光猫几个内置插件的作用及功能;用户无法对插件进行操作,默认光猫开机后,插件就开始运行了,这些插件都需要通过INTERNET连接出去&a…...