当前位置: 首页 > news >正文

【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(9 月 4 日论文合集)

文章目录

  • 一、检测相关(8篇)
    • 1.1 Impact of Image Context for Single Deep Learning Face Morphing Attack Detection
    • 1.2 A Theoretical and Practical Framework for Evaluating Uncertainty Calibration in Object Detection
    • 1.3 What Makes Good Open-Vocabulary Detector: A Disassembling Perspective
    • 1.4 Gap and Overlap Detection in Automated Fiber Placement
    • 1.5 Typing on Any Surface: A Deep Learning-based Method for Real-Time Keystroke Detection in Augmented Reality
    • 1.6 Application of Machine Learning in Melanoma Detection and the Identification of 'Ugly Duckling' and Suspicious Naevi: A Review
    • 1.7 Optimized Deep Feature Selection for Pneumonia Detection: A Novel RegNet and XOR-Based PSO Approach
    • 1.8 A Sequential Framework for Detection and Classification of Abnormal Teeth in Panoramic X-rays

一、检测相关(8篇)

1.1 Impact of Image Context for Single Deep Learning Face Morphing Attack Detection

图像上下文对单个深度学习人脸变形攻击检测的影响

https://arxiv.org/abs/2309.00549

由于技术进步而引起的安全问题的增加已经导致利用生理或行为特征来增强识别的生物计量方法的普及。人脸识别系统(FRSs)已经变得普遍,但是它们仍然容易受到图像操纵技术(诸如人脸变形攻击)的攻击。本研究调查了输入图像的对齐设置对深度学习人脸变形检测性能的影响。我们分析了人脸轮廓和图像上下文之间的相互联系,并提出了最佳的对齐条件,人脸变形检测。

1.2 A Theoretical and Practical Framework for Evaluating Uncertainty Calibration in Object Detection

目标检测中不确定度定标评定的理论与实践框架

https://arxiv.org/abs/2309.00464

深度神经网络的激增导致机器学习系统在各种现实世界的应用中变得越来越多。因此,在这些领域中对高度可靠的模型的需求不断增长,这使得在考虑深度学习的未来时,不确定性校准问题变得至关重要。在考虑对象检测系统时尤其如此,对象检测系统通常存在于安全关键应用中,例如自动驾驶和机器人技术。出于这个原因,这项工作提出了一种新的理论和实践框架来评估对象检测系统的不确定性校准的背景下。建议的不确定性校准指标的鲁棒性,通过一系列有代表性的实验。拟定不确定度校准度量的代码:https://github.com/pedrormconde/Uncertainty_Calibration_Object_Detection。

1.3 What Makes Good Open-Vocabulary Detector: A Disassembling Perspective

怎样才是好的开放词汇检测器:一种反汇编视角

https://arxiv.org/abs/2309.00227

开放词汇检测是一种新的目标检测方法,旨在定位和识别由无界词汇表定义的不可见目标。这是具有挑战性的,因为传统的检测器只能从预定义的类别中学习,因此无法检测和定位预定义词汇之外的对象。为了应对挑战,OVD利用预训练的跨模态VLM,例如CLIP、ALIGN等。以往的研究主要集中在开放式词汇分类部分,对本地化部分关注较少。我们认为,对于一个好的OVD检测器,分类和定位应并行研究的新对象类别。在这项工作中,我们表明,提高本地化以及交叉模态分类相辅相成,并组成一个很好的OVD检测器共同。我们分析了三个家庭的OVD方法与不同的设计重点。我们首先提出了一种普通方法,即,裁剪由定位器获得的边界框并将其调整大小到CLIP中。接下来,我们介绍另一种方法,它结合了一个标准的两阶段的对象检测器与CLIP。两阶段对象检测器包括视觉骨干、区域提议网络(RPN)和感兴趣区域(RoI)头。我们解耦RPN和ROI头(DRR),并使用RoIAlign提取有意义的功能。在这种情况下,它避免调整对象的大小。为了进一步加快训练时间并减少模型参数,我们将RPN和ROI头(CRR)结合起来作为第三种方法。我们对这三种类型的方法在不同的设置进行了广泛的实验。在OVD-COCO基准测试中,DRR获得了最佳性能,达到了35.8 Novel AP 50 _{50} 50,比之前的最新技术水平(SOTA)绝对提高了2.8。对于OVD-LVIS,在罕见类别中,DRR超过之前的SOTA 1.9 AP 50 _{50} 50。我们还提供了一个名为PID的对象检测数据集,并提供了PID的基线。

1.4 Gap and Overlap Detection in Automated Fiber Placement

自动铺丝中的缝隙和重叠检测

https://arxiv.org/abs/2309.00206

识别和纠正制造缺陷,特别是间隙和重叠,对于确保通过自动纤维铺放(AFP)生产高质量的复合材料部件至关重要。这些缺陷是最常见的问题,可以显着影响复合材料部件的整体质量。人工检查既耗时又耗力,使其成为一种效率低下的方法。为了克服这一挑战,实施自动化缺陷检测系统是最佳解决方案。在本文中,我们介绍了一种新的方法,使用光学相干断层扫描(OCT)传感器和计算机视觉技术来检测和定位复合材料零件中的间隙和重叠。我们的方法涉及生成复合表面的深度图图像,其突出显示表面上的复合带(或丝束)的高度。通过检测每个丝束的边界,我们的算法可以比较连续的丝束,并识别它们之间可能存在的间隙或重叠。任何超过预定公差阈值的间隙或重叠都被认为是制造缺陷。为了评估我们的方法的性能,我们将检测到的缺陷与专家注释的地面真相进行比较。结果表明,高水平的准确性和效率的差距和重叠分割。

1.5 Typing on Any Surface: A Deep Learning-based Method for Real-Time Keystroke Detection in Augmented Reality

任意表面打字:增强现实中基于深度学习的实时击键检测方法

https://arxiv.org/abs/2309.00174

令人沮丧的文本输入界面一直是参与增强现实(AR)中的社交活动的主要障碍。流行的选择,如空中键盘接口,无线键盘或语音输入,要么遭受不良的人体工程学设计,有限的准确性,或者只是尴尬地在公共场合使用。本文提出并验证了一种基于深度学习的方法,该方法使AR应用程序能够从任何AR耳机都可以捕获的用户视角RGB视频流中准确预测击键。这使得用户能够在任何平坦表面上执行打字活动,并且消除了对物理或虚拟键盘的需要。一个两阶段的模型,结合了现成的手标志提取器和一种新的自适应卷积递归神经网络(C-RNN),使用我们新建立的数据集进行训练。最终模型能够以约32 FPS自适应处理用户视角视频流。此基本模型在键入每分钟40个单词(wpm)时实现了91.05美元的整体准确率,这是普通人用双手在物理键盘上打字的速度。归一化Levenshtein距离也进一步证实了我们的方法在现实世界中的适用性。有希望的结果突出了我们的方法的可行性和我们的方法被集成到各种应用程序的潜力。我们还讨论了将这种技术引入生产系统所需的限制和未来的研究。

1.6 Application of Machine Learning in Melanoma Detection and the Identification of ‘Ugly Duckling’ and Suspicious Naevi: A Review

机器学习在黑色素瘤检测及‘丑小鸭’和可疑Naevi鉴别中的应用

https://arxiv.org/abs/2309.00265

被称为痣的皮肤病变表现出不同的特征,如大小、形状和颜色。“丑小鸭痣”的概念在监测黑色素瘤时起作用,指的是具有独特特征的病变,将其与附近的其他病变区分开来。由于同一个体内的病变通常具有相似性并遵循可预测的模式,因此丑小鸭痣突出为不寻常的,并可能表明癌性黑色素瘤的存在。计算机辅助诊断(CAD)已成为研究和开发领域的重要参与者,因为它将机器学习技术与各种患者分析方法相结合。其目的是提高准确性和简化决策,同时应对专业人员的短缺。这些自动化系统在专家可用性有限的皮肤癌诊断中尤其重要。因此,它们的使用可能会带来拯救生命的好处,并降低医疗保健的成本。考虑到早期与晚期黑色素瘤相比生存率的急剧变化,早期检测对于有效治疗和患者结局至关重要。机器学习(ML)和深度学习(DL)技术在皮肤癌分类中得到了普及,有效地解决了挑战,并提供了与专家相当的结果。本文广泛介绍了用于检测黑素瘤和可疑痣的现代机器学习和深度学习算法。它从皮肤癌和不同类型痣的一般信息开始,然后介绍AI,ML,DL和CAD。然后,本文讨论了各种ML技术的成功应用,如卷积神经网络(CNN)与皮肤科医生的表现相比,用于黑色素瘤检测。最后,它检查用于UD痣检测和识别可疑痣的ML方法。

1.7 Optimized Deep Feature Selection for Pneumonia Detection: A Novel RegNet and XOR-Based PSO Approach

用于肺炎检测的优化深度特征选择:一种基于RegNet和XOR的粒子群算法

https://arxiv.org/abs/2309.00147

肺炎仍然是儿童死亡的一个重要原因,特别是在资源和专业知识有限的发展中国家。肺炎的自动检测可以极大地帮助解决这一挑战。在这项研究中,提出了一种基于XOR的粒子群优化算法(PSO)来从RegNet模型的倒数第二层中选择深度特征,旨在提高CNN模型在肺炎检测上的准确性。异或粒子群优化算法通过只使用一个超参数进行初始化,并且每次迭代所需的计算时间最少,从而实现了算法的简化。此外,它实现了勘探和开发之间的平衡,导致在适当的解决方案上趋同。通过提取163个特征,达到了令人印象深刻的98%的准确度,这表明与以前的基于PSO的方法相当的准确度。所提出的方法的源代码可在GitHub存储库中获得。

1.8 A Sequential Framework for Detection and Classification of Abnormal Teeth in Panoramic X-rays

一种用于全景X线片异常牙齿检测和分类的序列框架

https://arxiv.org/abs/2309.00027

本文介绍了我们在MICCAI 2023年全景X射线挑战牙科计数和诊断的解决方案。我们的方法包括一个多步骤的框架,量身定制的任务的检测和分类异常牙齿。该解决方案包括三个连续阶段:牙齿实例检测、健康实例过滤和异常实例分类。在第一阶段,我们采用Faster-RCNN模型检测和识别牙齿。在随后的阶段中,我们设计了一个模型,该模型将预训练的U-net的编码途径与Vgg 16架构合并,该U-net针对牙齿病变检测进行了优化。最后一个模型被用来过滤出健康牙齿。然后,对任何识别出的异常牙齿进行分类,可能落入以下一种或多种条件:嵌埋、根尖周病变、龋、深龋。执行牙齿实例检测的模型实现了0.49的AP评分。负责识别健康牙齿的模型获得了0.71的F1评分。同时,针对多标签牙齿疾病分类训练的模型获得了0.76的F1评分。该代码可在https://github.com/tudordascalu/2d-teeth-detection-challenge上获得。

相关文章:

【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(9 月 4 日论文合集)

文章目录 一、检测相关(8篇)1.1 Impact of Image Context for Single Deep Learning Face Morphing Attack Detection1.2 A Theoretical and Practical Framework for Evaluating Uncertainty Calibration in Object Detection1.3 What Makes Good Open-Vocabulary Detector: A…...

游戏优化注意点

特效性能分析: 1、粒子数量太多,这个会对CPU的耗时产生一定的压力。 2、粒子的size太大,这样容易导致渲染的像素数量非常高。 3、Overdraw非常高,当场上粒子数非常高导致叠层很高,会造成Overdraw很高,这会…...

【unity3D】如何修改相机的默认视角

💗 未来的游戏开发程序媛,现在的努力学习菜鸡 💦本专栏是我关于游戏开发的学习笔记 🈶本篇是unity的如何修改相机的默认视角 如何修改相机的默认视角 Game窗口运行的话视角是这样的: 此时Scene窗口的视角是这样的&…...

Docker的初级使用

Docker的初级使用 Docker的安装1.1 如果之前安装过旧版本的Docker,可以使用下面命令卸载:1.2.安装docker1.3.启动docker1.4.配置镜像加速2.CentOS7安装DockerCompose2.1.下载2.2.修改文件权限2.3.Base自动补全命令:3.Docker镜像仓库3.1.简化版镜像仓库3.2.带有图形化界面版本…...

minimumLineSpacing和minimumInteritemSpacing问题研究

结论:minimumLineSpacing和minimumInteritemSpacing问题研究 (1)如果cell的宽度是固定的,方向是水平时, 1 3 5 2 4 6 minimumLineSpacing 是 12 到 34的距离 minimumInteritemSpacing 是1到2的距离 (2)如果cell的宽度是不固定的&#xff0…...

【操作系统】聊聊Linux内存工作机制

内存主要是用来存储系统和应用程序的指令、数据、缓存等 内存映射 内存是需要安全机制保护的,所以只有内核才可以直接访问物理内存。进程如果要访问内存需要通过独立的虚拟地址空间。 虚拟地址空间其实包含两部分。一部分是内核空间,另一部分就是用户…...

MySQL索引的类型有哪些?

分析&回答 从功能逻辑角度,可分为: 普通索引 INDEX(普通索引) ALTER TABLE table_name ADD INDEX index_name ( column )唯一索引 UNIQUE(唯一索引) ALTER TABLE table_name ADD UNIQUE (column)主键索引 PRIMARY KEY(主键索引…...

【JavaScript】在指定dom元素前面创建标签元素

一、基础操作过程 要在指定的DOM元素前面创建标签元素,有以下步骤: 获取指定的DOM元素:使用document.querySelector()或document.getElementById()等方法来获取指定的DOM元素。 const targetElement document.querySelector(#targetElement…...

ARMv8 TTBRx寄存器

ARMv8 TTBRx寄存器 1 TTBR0_ELx and TTBR1_ELx2 TTBR0_ELx2.1 TTBR0_EL12.2 TTBR0_EL22.3 TTBR0_EL33 TTBR13.1 TTBR1_EL13.2 TTBR1_EL2 4 访问TTBRx寄存器4.1 TTBR0_ELx4.2 TTBR1_ELx 5 TTBRx保留的是物理地址还是虚拟地址5.1 保存的是物理地址还是虚拟地址5.2 为什么是物理地…...

C51智能小车(循迹、跟随、避障、测速、蓝牙、wifie、4g、语音识别)总结

目录 1.电机模块开发 1.1 让小车动起来 1.2 串口控制小车方向 1.3 如何进行小车PWM调速 1.4 PWM方式实现小车转向 2.循迹小车 2.1 循迹模块使用 2.2 循迹小车原理 2.3 循迹小车核心代码 3.跟随/避障小车 3.1 红外壁障模块分析​编辑 3.2 跟随小车的原理 3.3 跟随小…...

回归预测 | MATLAB实现PCA-BP主成分降维结合BP神经网络多输入单输出回归预测

回归预测 | MATLAB实现PCA-BP主成分降维结合BP神经网络多输入单输出回归预测 目录 回归预测 | MATLAB实现PCA-BP主成分降维结合BP神经网络多输入单输出回归预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 MATLAB实现PCA-BP主成分降维算法结合BP神经网络多输入单输出回…...

Kubernetes(k8s)部署高可用多主多从的Redis集群

Kubernetes部署高可用多主多从的Redis集群 环境准备准备Kubernetes准备存储类 部署redis准备一个命名空间命令创建yaml文件创建(推荐) 准备redis配置文件准备部署statefulset的资源清单文件执行文件完成部署初始化集群 环境准备 准备Kubernetes 首先你…...

算法专题:前缀和

文章目录 Acwing:前缀和示例2845.统计趣味子数组的数目思路容易理解的写法:前缀和两层循环存在问题:超时 优化写法:两数之和思路,转换为哈希表 前缀和,就是求数组中某一段的所有元素的和。 求子数组中某一…...

bs4库爬取天气预报

Python不仅用于网站开发,数据分析,图像处理,也常用于爬虫技术方向,最近学习了解下,爬虫技术入门一般先使用bs4库,爬取天气预报简单尝试下。 第一步:首先选定目标网站地址 网上查询&#xff0c…...

l8-d8 TCP并发实现

一、TCP多进程并发 1.地址快速重用 先退出服务端,后退出客户端,则服务端会出现以下错误: 地址仍在使用中 解决方法: /*地址快速重用*/ int flag1,len sizeof (int); if ( setsockopt(fd, SOL_SOCKET, SO_REUSEADDR, &a…...

编写中间件以用于 Express 应用程序

概述 中间件函数能够访问请求对象 (req)、响应对象 (res) 以及应用程序的请求/响应循环中的下一个中间件函数。下一个中间件函数通常由名为 next 的变量来表示。 中间件函数可以执行以下任务: 执行任何代码。对请求和响应对象进行更改。结束请求/响应循环。调用堆…...

【2023年数学建模国赛】D题解题思路

2023年数学建模国赛D题解题思路 为了解决问题1、问题2和问题3,我们可以采用动态规划方法来制定生产计划,考虑了不确定性因素和多种可能情况的预案集。首先,我们需要定义一些变量和符号: T T T:总的养殖周期&#xff0…...

python爬虫之正则表达式学习

网络安全离不开脚本和工具的开发,python很多又需要正则表达式。 这是一个很好的学习正则表达式的项目 https://github.com/ziishaned/learn-regex/blob/master/translations/README-cn.md 基本匹配 正则表达式其实就是在执行搜索时的格式,它由一些字…...

智慧能源方案:TSINGSEE青犀AI算法中台在能源行业的应用

一、方案背景 互联网、物联网、人工智能等新一代信息技术引领新一轮产业革命,加快能源革命步伐。尤其是随着人工智能技术的不断发展,AI智能检测与识别技术在能源行业的应用也越来越广泛。与此同时,国家出台多项政策,将智慧能源纳…...

达梦数据库awr报告收集

1、找出快照点snap_id与时间的对应关系 SYS.WRM$_SNAPSHOT表中记录了快照点snap_id与时间的对应关系 例如如下语句可以得出2023-09-04这一天各个时间点对应的快照点snap_id select snap_id,end_interval_time from SYS.WRM$_SNAPSHOT where end_interval_time between to…...

c语言练习43:深入理解strcmp

深入理解strcmp strcmp的主要功能是用来比较两个字符串 模拟实现strcmp 比较两个字符串对应位置上的大小 按字典序进行比较 例如: 输入:abc abc 输出:0 输入:abc ab 输出:>0的数 输入:ab abc …...

NUC980webServer开发

目录 1.RTL8189FTV驱动移植 2.wifi配置工具hostapd移植 1.openssl-1.0.2r交叉编译 2.libnl-3.2.25.tar.gz交叉编译 3.hostapd-2.9.tar.gz交叉编译 4.移植相关工具到开发板 1.RTL8189FTV驱动移植 1. 把驱动文件源码放在linux源码的drivers/net/wireless/realtek/rtlwifi/目录…...

驱动开发--day2

实现三盏灯的控制,编写应用程序测试 head.h #ifndef __HEAD_H__ #define __HEAD_H__#define LED1_MODER 0X50006000 #define LED1_ODR 0X50006014 #define LED1_RCC 0X50000A28#define LED2_MODER 0X50007000 #define LED2_ODR 0X50007014#endif mychrdev.c #inc…...

用户促活留存新方式——在APP中嵌入小游戏

随着APP同类产品的不断出现,APP开发者们面临着激烈的竞争,很多APP下载后被新的APP取代,获客成本越来越高。同时开发者还会面临用户粘性差、忠诚度低、用完即走、留存困难,商业化价值被大大缩减。 在APP中植入小游戏来提高用户活跃…...

MySQL 8.0.34(x64)安装笔记

一、背景 从MySQL 5.6到5.7,再到8.0,版本的跳跃不可谓不大。安装、配置的差别也不可谓不大,特此备忘。 二、过程 (1)获取MySQL 8.0社区版(MySQL Community Server)   从 官网 字样 “MySQL …...

物流供应商实现供应链自动化的3种方法

当前影响供应链的全球性问题(如新冠肺炎疫情)正在推动许多物流供应商重新评估和简化其流程。运输协调中的摩擦只会加剧供应商无法控制的现有延误和风险。值得庆幸的是,供应链专业人员可以通过端到端的供应链自动化消除延迟,简化与合作伙伴的沟通&#xf…...

Mysql更新时间列只改日期为指定日期不更改时间

场景 Mysql分表后同结构不同名称表之间复制数据以及Update语句只更新日期加减不更改时间: Mysql分表后同结构不同名称表之间复制数据以及Update语句只更新日期加减不更改时间_霸道流氓气质的博客-CSDN博客 上面通过如下方式实现日期列增加指定天数。 UPDATE bus…...

实时测试工具 Visual Studio 扩展 NCrunch 4.18 Crack

NCrunch Visual Studio 扩展 .NET 的终极实时测试工具 在编码时查看实时测试结果和内联指标。 下载v4.18 发布于 2023 年 7 月 17 日 跳过视频至: 代码覆盖率 指标 分布式处理 配置 发动机模式 Visual Studio 自动并发测试 NCrunch 是一个完全自动化的测试扩展&a…...

Neo4j 基本语法

一、基本语法 1、新建节点 (1)基本语法: () 代表节点 示例: CREATE (u:User {uid:970939424 }) // 节点类型为User,属性值为uid970939424CREATE (u:Round {rid:7194842697444819113 }) // 节点类型为Rou…...

docker常见面试题

1.什么是docker docker是一个容器化平台,类似于一个集装箱,集装箱与集装箱之间互不影响,docker平台就是一个软件集装箱平台,我们可以构建应用程序,将其所有的依赖打包到一个容器中,然后就很方便的可以在其…...

延吉有没有做网站的/常见的网络营销方法有哪些

React Hooks+Laravel 前端博客实战 阐述对公用头部的微调编写首页的左右两列布局其他页面的大结构复制`blog\pages\list.js`blog\pages\detailed.js阐述 我们的博客主体分为左右两栏布局,左边是主要展示的是文章列表,右边是个人信息和一些广告的东西。并且也是在不同的终端中…...

卢松松博客主题 wordpress/深圳最好的外贸seo培训

宁夏十大中职学校一览表2019-09-04 09:45:02文/陶凯月宁夏中职学校有海原县职业中学、泾源县民族职业中学等等,下面就和小编一起了解一下吧,仅供大家参考。宁夏十大中职学校有哪些序号学校名称办学性质学校地址1银川百年农工子弟职业学校民办宁夏回族自治…...

影响网站排名的因素/国际新闻大事

第一步 : yum install -g nodejs //安装node 第二步 yum install n //安装管理node的模块 第三部 n table //node升级 第四步 npm install vue-cli 第五步 git clone 项目地址 //拉取源代码 第六步 npm install //安装项目依赖 失败:用淘宝镜…...

网站建设协议/短视频seo询盘系统

用java编写程序,根据考试成绩的等级打印出百分制分数段;设A为90分以上,B为80分以上,C为70分以上,D为60分以上,E为59分以下。要求在程序中使用开关语句。上级运行其结果是否符合设计要求;import …...

金华哪里有做网站的公司4000-262-/前端开发培训机构推荐

下载的同时记录下载次数,不能用超链接直接下载,而应该用超链接跳到一个aspx中间页 面,并在这个页面的CS文件中Page_Load方法中,用Response.Redirect("url");指向下载的文件。这样点击下载后,客户看 到的一直…...

深圳网站快速备案/百度网站

From: http://www.macx.cn/thread-2018736-1-1.html 有些童鞋们 使用 MBP或 MBA 连接到外部显示器时,都可能想要禁用其内部屏幕。 这一般能透过两种方法,但因为 Mac OS X Lion 10.7 上的内部屏幕更稳定,或许会希望继续使用。 要禁用OS X Lio…...