当前位置: 首页 > news >正文

【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(8 月 14 日论文合集)

文章目录

  • 一、检测相关(7篇)
    • 1.1 Continual Face Forgery Detection via Historical Distribution Preserving
    • 1.2 Exploring Predicate Visual Context in Detecting of Human-Object Interactions
    • 1.3 Out-of-Distribution Detection for Monocular Depth Estimation
    • 1.4 Cyclic-Bootstrap Labeling for Weakly Supervised Object Detection
    • 1.5 MS3D++: Ensemble of Experts for Multi-Source Unsupervised Domain Adaption in 3D Object Detection
    • 1.6 YOLOrtho -- A Unified Framework for Teeth Enumeration and Dental Disease Detection
    • 1.7 Aphid Cluster Recognition and Detection in the Wild Using Deep Learning Models

一、检测相关(7篇)

1.1 Continual Face Forgery Detection via Historical Distribution Preserving

基于保持历史分布的连续人脸伪造检测

https://arxiv.org/abs/2308.06217

人脸伪造技术发展迅速,并带来了严重的安全威胁。现有的人脸伪造检测方法试图学习可推广的特征,但它们仍然缺乏实际应用。此外,在历史训练数据上微调这些方法在时间和存储方面是资源密集型的。在本文中,我们关注一个新颖且具有挑战性的问题:连续人脸伪造检测(CFFD),旨在有效地学习新的伪造攻击,而不会忘记以前的攻击。具体来说,我们提出了一个历史分布保存(HDP)的框架,保留和保存的历史面孔的分布。为了实现这一目标,我们使用通用对抗扰动(UAP)来模拟历史伪造分布,并使用知识蒸馏来保持真实人脸在不同模型中的分布变化。我们还构建了一个新的基准CFFD与三个评估协议。我们在基准测试上的大量实验表明,我们的方法优于最先进的竞争对手。

1.2 Exploring Predicate Visual Context in Detecting of Human-Object Interactions

谓词视觉语境在人-物交互检测中的探索

https://arxiv.org/abs/2308.06202

最近,DETR框架已成为人-物交互(HOI)研究的主导方法。特别地,基于两级变压器的H 0 I检测器是最具性能和训练效率的方法之一。然而,这些通常条件的HOI分类的对象特征,缺乏细粒度的上下文信息,避开姿势和方向信息有利于视觉线索的对象身份和框的四肢。这自然阻碍了复杂或模糊的相互作用的识别。在这项工作中,我们通过可视化和精心设计的实验来研究这些问题。因此,我们研究如何最好地重新引入图像功能,通过交叉注意。通过改进的查询设计,对键和值的广泛探索,以及作为空间指导的框对位置嵌入,我们的模型具有增强的谓词视觉上下文(PViC),在HICO-DET和V-COCO基准测试中优于最先进的方法,同时保持低的训练成本。

1.3 Out-of-Distribution Detection for Monocular Depth Estimation

用于单目深度估计的非分布检测

https://arxiv.org/abs/2308.06072

在单目深度估计中,不确定性估计方法主要针对图像噪声引入的数据不确定性。与之前的工作相比,我们解决了由于缺乏知识而导致的不确定性,这与检测未由训练分布表示的数据(所谓的分布外(OOD)数据)有关。出于异常检测的动机,我们建议从基于重构误差的编码器-解码器深度估计模型检测OOD图像。给定用固定深度编码器提取的特征,我们训练图像解码器以仅使用分布内数据进行图像重建。因此,OOD图像导致高重建误差,我们使用该误差来区分分布内和分布外样本。我们在标准NYU Depth V2和KITTI基准上建立了我们的实验,作为分布数据。我们的事后方法在不同的模型上表现得非常好,并且在不修改训练的编码器-解码器深度估计模型的情况下优于现有的不确定性估计方法。

1.4 Cyclic-Bootstrap Labeling for Weakly Supervised Object Detection

用于弱监督目标检测的循环Bootstrap标记法

https://arxiv.org/abs/2308.05991

弱监督对象检测的最新进展是多实例检测网络(MIDN)和有序在线细化的组合。然而,只有图像级的注释,MIDN不可避免地分配高分,一些意想不到的区域建议时,生成伪标签。这些不准确的高评分区域建议将误导后续细化模块的训练,从而妨碍检测性能。在这项工作中,我们探讨了如何改善质量的伪标记MIDN。形式上,我们设计了循环引导标记(CBL),一种新的弱监督对象检测管道,它优化了MIDN与排名信息从一个可靠的教师网络。具体来说,我们通过引入加权指数移动平均策略,利用各种细化模块,获得了这种教师网络。提出了一种新的类特定排序提取算法,利用加权集成教师网络的输出提取具有排序信息的MIDN。因此,MIDN被引导分配更高的分数,以准确的建议,在他们的邻居,从而有利于后续的伪标记。在流行的PASCAL VOC 2007 & 2012和COCO数据集上进行了大量的实验,证明了我们的CBL框架的优越性能。代码将在https://github.com/Yinyf0804/WSOD-CBL/上提供。

1.5 MS3D++: Ensemble of Experts for Multi-Source Unsupervised Domain Adaption in 3D Object Detection

MS3D++:三维目标检测中的多源无监督域自适应专家集成

https://arxiv.org/abs/2308.05988

在不熟悉的领域部署3D探测器已被证明会导致检测率急剧下降高达70-90%,这是由于激光雷达、地理区域或天气条件与原始训练数据集的差异。该域间隙导致对密集观察的对象的缺失检测、未对准的置信度分数和增加的高置信度假阳性,使得检测器高度不可靠。为了解决这个问题,我们引入了MS 3D ++,这是一个用于3D对象检测中多源无监督域自适应的自训练框架。MS 3D ++通过生成高质量的伪标签提供了一种简单的域自适应方法,使3D探测器能够适应各种激光雷达类型,而无论其密度如何。我们的方法有效地融合了来自不同源域的多帧预训练检测器的集合的预测,以提高域泛化。随后,我们在时间上细化预测,以确保在框定位和对象分类的时间一致性。此外,我们提出了一个深入的研究各种3D检测器组件的性能和特质在跨域的上下文中,改进跨域检测器集成提供有价值的见解。在Waymo、nuScenes和Lyft上的实验结果表明,使用MS 3D ++伪标签训练的检测器实现了最先进的性能,与在低密度和高密度激光雷达的鸟瞰图(BEV)评估中使用人类注释标签进行训练的性能相当。

1.6 YOLOrtho – A Unified Framework for Teeth Enumeration and Dental Disease Detection

YOLOrtho–牙齿计数和牙病检测的统一框架

https://arxiv.org/abs/2308.05967

通过全景 X 射线图像检测牙齿疾病是牙医的标准程序。 通常,牙医需要识别疾病并找到受感染的牙齿。 虽然已经开发了许多采用这种两步过程的机器学习模型,但还没有一个可以同时识别牙齿及其相关疾病的端到端模型。 为了填补这一空白,我们开发了 YOLOrtho,这是一个用于牙齿计数和牙科疾病检测的统一框架。 我们根据 Dentex Challenge 2023 数据开发模型,该数据由三种不同类型的注释数据组成。 第一部分标记为象限,第二部分标记为象限和计数,第三部分标记为象限、计数和疾病。 为了进一步改进检测,我们利用塔夫茨牙科公共数据集。 为了充分利用数据并同时学习牙齿检测和疾病识别,我们将疾病制定为附加到相应牙齿的属性。 由于牙齿枚举中位置关系的性质,我们在模型中用 CoordConv 替换卷积层,以为模型提供更多位置信息。 我们还调整了模型架构,并在 FPN 中插入了一个上采样层,以支持大目标检测。 最后,我们提出了一种牙齿布局的后处理策略,该策略基于线性和分配来校正牙齿计数。 实验结果表明我们的模型超过了基于扩散的大型模型。

1.7 Aphid Cluster Recognition and Detection in the Wild Using Deep Learning Models

基于深度学习模型的野外麦长管蚜识别与检测

https://arxiv.org/abs/2308.05881

蚜虫侵扰对作物生产、农村社区和全球粮食安全构成重大威胁。虽然化学虫害防治对于最大限度地提高产量至关重要,但在整个田地中施用化学品既不可持续,又成本高昂。因此,蚜虫的精确定位和管理对于有针对性地施用农药至关重要。本文主要关注使用深度学习模型来检测蚜虫集群。我们提出了一种新的方法来估计感染水平检测蚜虫集群。为了促进这项研究,我们从高粱地捕获了一个大规模的数据集,手动选择了5,447张包含蚜虫的图像,并在这些图像中注释了每个单独的蚜虫集群。为了便于使用机器学习模型,我们通过将图像裁剪成补丁来进一步处理图像,从而产生包括151,380个图像补丁的标记数据集。然后,我们在蚜虫数据集上实现并比较了四种最先进的对象检测模型(VFNet,GFLV2,PAA和ATSS)的性能。大量的实验结果表明,所有的模型产生稳定的平均精度和召回方面的相似性能。然后,我们提出合并邻近的集群,并删除由裁剪引起的微小集群,性能进一步提高了约17%。该研究证明了使用机器学习模型自动检测和管理昆虫的可行性。标记的数据集将公开提供给研究社区。

相关文章:

【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(8 月 14 日论文合集)

文章目录 一、检测相关(7篇)1.1 Continual Face Forgery Detection via Historical Distribution Preserving1.2 Exploring Predicate Visual Context in Detecting of Human-Object Interactions1.3 Out-of-Distribution Detection for Monocular Depth Estimation1.4 Cyclic-…...

自学设计模式(类图、设计原则、单例模式 - 饿汉/懒汉)

设计模式需要用到面向对象的三大特性——封装、继承、多态(同名函数具有不同的状态) UML类图 eg.—— 描述类之间的关系(设计程序之间画类图) : public; #: protected; -: private; 下划线: static 属性名:类型(默认值…...

python爬虫10:selenium库

python爬虫10:selenium库 前言 ​ python实现网络爬虫非常简单,只需要掌握一定的基础知识和一定的库使用技巧即可。本系列目标旨在梳理相关知识点,方便以后复习。 申明 ​ 本系列所涉及的代码仅用于个人研究与讨论,并不会对网站产…...

c++ java rgb与nv21互转

目录 jni函数 c++ rgb转nv21,可以转,不报错,但是转完只有黑白图 java yuv420保存图片,先转nv21,再保存ok: c++ yuv420月bgr互转,测试ok jni函数 JNIEXPORT void JNICALL Java_com_tencent_blazefacencnn_BlazeFaceNcnn_encode(JNIEnv *env,jobject thiz, jobject in…...

多视图聚类(multi-view clustering)简介

多视图聚类 目前大概有以下几种: 多视图k-means聚类多视图谱聚类多视图图聚类多视图子空间聚类 (multi-view subspace clustering)深度学习多视图聚类 (deep multi-view clustering) 其中多视图子空间聚类具有不错的数据表征能力。 对于多视图子空间聚类而言&…...

wazhu配置以及漏洞复现

目录 1.wazhu配置 进入官网下载 部署wazhu 修改网络适配器 重启 本地开启apache wazhu案例复现 前端页面 执行 1.wazhu配置 进入官网下载 Virtual Machine (OVA) - Installation alternatives (wazuh.com) 部署wazhu 修改网络适配器 重启 service network restart 本地…...

javaweb项目部署linux服务器遇到的问题

其他有关本次部署内容请参考本站其他文章 javaweb项目要用war包 IntelliJ IDEA 可以打包out里的子目录 D:\D盘文件\浏览器\webshop\out\artifacts\webshop_war_exploded>jar cvf webshop.war * 方法来源视频 18、web项目的打包与发布_哔哩哔哩_bilibili myeclipse项目…...

【数据结构OJ题】环形链表

原题链接:https://leetcode.cn/problems/linked-list-cycle/description/ 目录 1. 题目描述 2. 思路分析 3. 代码实现 1. 题目描述 2. 思路分析 整体思路:定义快慢指针fast,slow,如果链表确实有环,fast指针一定会…...

PySpark-核心编程

2. PySpark——RDD编程入门 文章目录 2. PySpark——RDD编程入门2.1 程序执行入口SparkContext对象2.2 RDD的创建2.2.1 并行化创建2.2.2 获取RDD分区数2.2.3 读取文件创建 2.3 RDD算子2.4 常用Transformation算子2.4.1 map算子2.4.2 flatMap算子2.4.3 reduceByKey算子2.4.4 Wor…...

vue 在IOS移动端中 windon.open 等跳转外部链接后,返回不触发vue生命周期、mounted等相关事件-解决方法

做了一个列表的h5页面,通过点击列表跳转到外部链接,然后返回是回到原来页面状态,类似缓存。发现在ios端返回后,vue 的mounted() 、create()、路由监听等方法都不会执行。在安卓和pc 端都能正常调用。 解决方案:监听pa…...

股票预测和使用LSTM(长期-短期-记忆)的预测

一、说明 准确预测股市走势长期以来一直是投资者和交易员难以实现的目标。虽然多年来出现了无数的策略和模型,但有一种方法最近因其能够捕获历史数据中的复杂模式和依赖关系而获得了显着的关注:长短期记忆(LSTM)。利用深度学习的力…...

Docker搭建个人网盘、私有仓库

1、使用mysql:5.6和 owncloud 镜像,构建一个个人网盘 [rootlocalhost ~]# docker pull mysql:5.6 [rootlocalhost ~]# docker pull owncloud [rootlocalhost ~]# docker run -itd --name mysql --env MYSQL_ROOT_PASSWORD123456 mysql:5.6 [rootlocalhost ~]# doc…...

3种获取OpenStreetMap数据的方法【OSM】

OpenStreetMap 是每个人都可以编辑的世界地图。 这意味着你可以纠正错误、添加新地点,甚至自己为地图做出贡献! 这是一个社区驱动的项目,拥有数百万注册用户。 这是一个社区驱动的项目,旨在在开放许可下向每个人提供所有地理数据。…...

数据处理与统计分析——MySQL与SQL

这里写目录标题 1、初识数据库1.1、什么是数据库1.2、数据库分类1.3、相关概念1.4、MySQL及其安装1.5、基本命令 2、基本命令2.1、操作数据库2.2、数据库的列类型2.3、数据库的字段属性2.4 创建和删除数据库表2.5、数据库存储引擎2.6、修改数据库 3、MySQL数据管理3.1、外键 My…...

OpenCV之特征点匹配

特征点选取 特征点探测方法有goodFeaturesToTrack(),cornerHarris()和SURF()。一般使用goodFeaturesToTrack()就能获得很好的特征点。goodFeaturesToTrack()定义: void goodFeaturesToTrack( InputArray image, OutputArray corners,int maxCorners, double qualit…...

浅谈开关柜绝缘状态检测与故障诊断

贾丽丽 安科瑞电气股份有限公司 上海嘉定 201801 摘要:电力开关柜作为电力系统的关键设备广泛应用于输电配电网络,其运行可靠性直接影响着电力系统供电质量及安全性能。开关柜绝缘状态检测与故障诊断是及时维修、更换和预防绝缘故障的重要技术手段。在阐述开关柜绝…...

Mybatis 动态 SQL

动态 SQL 1. if 标签2. trim 标签3. where 标签4. set 标签5. foreach 标签 1. if 标签 if 标签有很多应用场景, 例如: 在用户进行注册是有些是必填项有些是选填项, 这就会导致前端传入的参数不固定如果还是将参数写死就很难处理, 这时就可以使用 if 标签进行判断 <insert …...

Android studio之 build.gradle配置

在使用Android studio创建项目会出现两个build.gradle&#xff1a; 一. Project项目级别的build.gradle &#xff08;1&#xff09;、buildscript{}闭包里是gradle脚本执行所需依赖&#xff0c;分别是对应的maven库和插件。 闭包下包含&#xff1a; 1、repositories闭包 2、d…...

【ElasticSearch】一键安装IK分词器无需其他操作

要注意的时下面命令中的es是我容器的名称&#xff0c;要换成你对应的es容器名 docker exec -it es /bin/bash # 进入容器 ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis- ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.1…...

在Ubuntu上启动一个简单的用户登录接口服务

一个简单的用户登录接口 我使用 Python 和 Flask 框架来创建这个接口 首先&#xff0c;确保你已经安装了 Python 和 Flask。如果没有安装&#xff0c;可以通过以下命令在 Ubuntu 上安装&#xff1a; sudo apt update sudo apt install python3 python3-pip pip3 install Fla…...

【PHP】函数-作用域可变函数匿名函数闭包常用系统函数

文章目录 函数定义&使用命名规则参数种类默认值引用传递函数返回值return关键字 作用域global关键字静态变量 可变函数匿名函数闭包常用系统函数输出函数时间函数数学函数与函数相关函数 函数 函数&#xff1a;function&#xff0c;是一种语法结构&#xff0c;将实现某一个…...

Python使用pymysql和sqlalchemy访问MySQL的区别

Python使用pymysql和sqlalchemy访问MySQL的区别 1. 两个数据库连接工具的对比 pymysql和sqlalchemy是两个Python中经常用于与MySQL数据库交互的库。都可以连接MySQL数据库&#xff0c;但它们有明显的区别。 &#xff08;1&#xff09;特点 pymysql是一个Python模块&#xf…...

ubuntu服务器的mysql,更改root密码,并允许远程连接

我只是一个搬运工 更改密码远程连接...

微信小程序【构建npm】使用记录

:: 问题 使用原生微信小程序开发时&#xff0c;通过官方 typescript 模板构建的小程序无法正确执行 构建npm 成功&#xff0c;从而导致我想通过 npm 安装并使用第三方库出现问题 :: 开发环境&#xff08;可参照&#xff09; 设备&#xff1a;macOS Ventura 13.0 微信开发者工…...

mybatis入门的环境搭建及快速完成CRUD(增删改查)

又是爱代码的一天 一、MyBatis的介绍 ( 1 ) 背景 MyBatis 的背景可以追溯到 2002 年&#xff0c;当时 Clinton Begin 开发了一个名为 iBATIS 的持久化框架。iBATIS 的目标是简化 JDBC 编程&#xff0c;提供一种更直观、易用的方式来处理数据库操作。 在传统的 JDBC 编程中&…...

《HeadFirst设计模式(第二版)》第九章代码——组合模式

上一章链接&#xff1a; 《HeadFirst设计模式(第二版)》第九章代码——迭代器模式_轩下小酌的博客-CSDN博客 前面说到&#xff0c;当一个菜单里面出现了子菜单的时候&#xff0c;前面的迭代器模式得换成组合模式。 组合模式&#xff1a; 允许将对象组合成树形结构来表现部分-整…...

iOS17 widget Content margin

iOS17小组件有4个新的地方可以放置分别是&#xff1a;Mac桌面、iPad锁屏界面、 iPhone Standby模式、watch的smart stack Transition to content margins iOS17中苹果为widget新增了Content margin, 使widget的内容能够距离边缘有一定的间隙&#xff0c;确保内容显示完整。这…...

计网第四章(网络层)(一)

前面学习了数据链路层&#xff0c;我们可以实现一个网络的内部通信&#xff0c;可是要把这些网络互连起来形成更大的互连网&#xff0c;就需要用网络层互联设备路由器。而有了路由器的参与&#xff0c;就有不同网络、跨网络的概念诞生。 这时候我想大家也能理解为什么叫网络层…...

【前端】vue3 接入antdv表单校验

1/&#x1f355;背景 1、表单校验是非常常见的需求&#xff0c;能够有效的拦截大部分的错误数据&#xff0c;提升效率。 2、快速的给使用者提示和反馈&#xff0c;用户体验感非常好。 3、成熟的表单校验框架&#xff0c;开发效率高&#xff0c;bug少。 最近使用的是vue3antdv的…...

CY3-COOH在蛋白质定位的特点1251915-29-3星戈瑞

​欢迎来到星戈瑞荧光stargraydye&#xff01;小编带您盘点&#xff1a; CY3-COOH是一种橙红色荧光标记试剂&#xff0c;可以用于蛋白质定位研究。**以下是CY3-COOH在蛋白质定位的特点和应用&#xff1a; 细胞定位&#xff1a;**将CY3-COOH标记到特定蛋白质上&#xff0c;可以…...

企业英文网站制作/什么是网络营销公司

首先&#xff0c;必须说明的是网络上的数据是流式传送的&#xff0c;也就是经常说的stream&#xff0c;流式传送的特点就是一方发送的是1234四个字节&#xff0c;那么接收端收到的必然是1234四个字节&#xff0c;顺序完全相同。其次&#xff0c;必须说明的是主机字节序&#xf…...

医院网站建设水平/聊城seo培训

ZROI#1001 这显然可以\(\Theta(n^3)\)枚举统计. 也显然可以\(\Theta(n)\)处理前缀和然后\(\Theta(n^2)\)枚举统计. 然后我们发现,前缀和之后,我们就把问题转化成了这样: 给定一个三元组序列,求有多少对\((i,j)\)满足对应位置的三元组每个位置的差都相等. 即\((j_1-i_1j_2-i_2j_…...

建一个网站容易吗/核心关键词和长尾关键词举例

后台线程&#xff1a; 指为其他线程提供服务的线程&#xff0c;也称为守护线程。JVM的垃圾回收线程就是一个后台线程。 前台线程&#xff1a; 是指接受后台线程服务的线程&#xff0c;其实前台后台线程是联系在一起&#xff0c;就像傀儡和幕后操纵者一样的关系。傀儡是前台线…...

对网站做维护/seo是什么东西

你好&#xff0c;RMAN是不支持表级备份的&#xff0c;只是从Oracle 12C R1之后有了对表级的恢复支持&#xff0c;Networker NMDA 1.6以及8.2都是支持这个特性的;需要注意的是有Oracle有一些前提条件使用这个特性&#xff0c;只要这些满足了Networker都能支持;Prerequisites for…...

南宁网站建设超博网络/比较开放的浏览器

在一个笔记本上开两个虚拟机有点卡&#xff0c;而且太麻烦&#xff0c;就把metasploit的目标靶机放在别的机器上了&#xff0c;ip自己配置了一下&#xff0c;目标主机&#xff1a;192.168.137.254入侵机:192.168.137.253目标机上存在漏洞&#xff1a;KingView 6.53版本CVE-2011…...

网站建设 时间安排/推广途径有哪些

python模拟各大网站登陆方式&#xff0c;以及一些爬虫程序 仅供练习使用&#xff0c;代码注释很详细 走过路过的大佬们&#xff0c;记得给个star支持一下&#xff0c;嘻嘻嘻? 收集了一些各大网站登陆方式&#xff0c; 和一些网站的爬虫程序&#xff0c;有的是通过selenium登…...