当前位置: 首页 > news >正文

【CVPR红外小目标检测】红外小目标检测中的非对称上下文调制(ACM)

论文题目:
Asymmetric Contextual Modulation for Infrared Small Target Detection 红外小目标检测中的非对称上下文调制

红外小目标数据集

  • 目标个数分布:约90%图片中只有一个目标,约10%图片有多个目标(在稀疏/显著的方法中,可能会因全局独特的假设而被忽略)
  • 目标面积分布:约55%的目标面积占比在0.02%之内(即300300的图片中,目标像素为33)
  • 目标亮度分布:仅有35%的目标亮度是全图最亮。考虑到65%的目标具有与背景非常相似甚至更暗的亮度。

数据集:链接:https://pan.baidu.com/s/1dwLWwtlQcETiKU_4deJvUA?pwd=zwzs
    提取码:zwzs

文章目录

      • 红外小目标数据集
      • 1摘要
      • 2介绍
        • 问题:
        • 贡献:
      • 3 SIRST
      • 4 不对称的上下文调制
        • 4.1 Rethinking自上而下的注意力调节
        • 4.2 自下而上逐点注意调制
        • 4.3 非对称上下文调制模块
        • 4.4 FPN和U-Net
      • 5 实验
        • 5.1 消融实验

1摘要

首先贡献了一个具有高质量注释的开放数据集。提出了一种非对称上下文调制模块,专门用于检测红外小目标。

2介绍

问题:

1、缺乏公共数据集:深度学习需要数据。
2、最小的内在信息:SPIE将红外小目标定义为256×256图像的总空间范围小于80像素(9×9)。纹理或形状特征的缺乏使得纯粹以目标为中心的表示不足以进行可靠的检测。特别是在深度网络中,小目标很容易被复杂的环境淹没。
3、分辨率和语义学之间的矛盾:红外小目标往往淹没在复杂背景中,信杂比较低。对于网络来说,检测这些虚警较低的暗目标既需要对整个红外图像的高级语义理解,也需要精细分辨率的预测图,这是深度网络的内在矛盾,因为它们通过逐渐减弱特征大小来学习更多的语义表示。

贡献:

  提出了一种非对称上下文调制(ACM)机制,这是一种可以集成到多个主机网络中的插件模块。该方法补充了最先进自上而上的高级语义反馈路径,采用反向自下而上的上下文调制路径,将较小尺度的视觉细节编码到更深的层次,我们认为这是为红外小目标实现更好的性能的关键因素。
  这种高级和低级特征之间的相互调制以非对称的方式实现的,其中 自上而下 的调制是由传统的全局通道注意调制(GCAM)将高级大规模语义信息传播到浅层,而 自下而上的调制是通过像素级通道注意调制(PCAM)实现的,以保持和突出高级特征中的红外小目标。

  • 全局通道注意调制(GCAM):
      全局通道注意力结构可以使神经网络在训练过程中建模特征图各个通道的重要性,自动判断哪些通道上的信息为有用信息,哪些通道上的信息为噪声信息。全局通道注意力结构以SENet的通道注意力结构为基础,添加了批归一化和ReLU激活用于调整权重分布,残差结构增强了模型对强噪声和高冗余数据的处理能力。全局通道注意力模块的输入为尺寸为H×W×C的特征图X,输出为维度是1×1×C的通道权重矩阵。
  • 像素级通道注意调制(PCAM):

3 SIRST

  离群值(outlier):样本中的一个或几个观测值,它们离其他观测值较远,暗示它们可能来自不同的总体。离群点是指与其他观测值有显著差异的数据点。由于目标太小,缺乏内在特征,它们都被归为一个类别,没有进一步区分其特定类别。每个目标都通过观察它的移动顺序来确定,以确保它是一个真正的目标,而不是像素级的脉冲噪声。

3.1 数据集统计

  • 每幅图像的目标数分布如图所示,大约90%的图像只包含一个单一的目标。这一事实支持了许多模型驱动的方法,将检测任务转换为寻找最稀疏或最显著的目标。然而,应该注意的是,大约10%的图像仍然包含额外的目标,这些目标在这种独特的假设下会被忽略。
  • 其中约55%的目标只占图像面积的0.02%。给定一个300×300的图像,目标仅仅是3×3像素。一般来说,检测较小的物体需要更多的上下文信息,而红外小目标由于低对比度和背景杂乱而将这一难度推到极端程度。
  • 只有35%的目标是图像中最亮的。因此,在图像中选择最亮的像素不是一个好主意,导致检测率为0.35,误报率为65%。作为比较,本文提出的方法的检出率为0.84,误报率为0.0065%,要小10000倍。
    在这里插入图片描述

4 不对称的上下文调制

4.1 Rethinking自上而下的注意力调节

给定具有C通道和大小为H×W的特征图的低水平特征X和高水平特征Y,自上而下的注意力调节可以公式化为
在这里插入图片描述
在这里插入图片描述

随着网络的深入,这两个假设不一定适用于红外小目标,因为在高层特征中,小目标很容易被背景淹没,并且它们的特征在全球平均池中也会被削弱。

4.2 自下而上逐点注意调制

逐点通道注意力调制模块,其中每个空间位置的通道特征上下文被单独聚合.
在这里插入图片描述
在这里插入图片描述

4.3 非对称上下文调制模块

同时利用自上而下的全局注意调制和自下而上的局部注意调制,以交换多尺度上下文,从而对语义信息和空间细节进行更丰富的编码。
在这里插入图片描述

4.4 FPN和U-Net

构建新的网络,即ACM-FPN和ACM-U-Net,用于红外小目标检测任务。

在这里插入图片描述

5 实验

  选择FPN和U-Net作为主干部网络,其中ResNet-20是两者的骨干。ROC曲线IoU和所提出的nIoU被选择作为评估指标。SoftIoU作为损失函数,选择Nesterov加速梯度方法作为优化器。0.05的学习率。Bachsize=8,epoch=
300.
数据驱动的方法:
1)顶帽滤波器
2)局部对比度方法(LCM)
3)改进的LCM(ILCM)
4)局部显著性方法(LSM)
5)面核和随机游走器(FKRW)
6)基于多尺度斑块的对比度测量(MPCM)
7)红外斑块图像模型(IPI)
8)基于奇异值部分和的非负性IPI模型(NIPPS)
9)重加权红外斑块张量模型(RIPT)
10)张量核范数部分和(PSTNN)
11)非凸秩近似最小化(NRAM)

5.1 消融实验

1)下采样方案的影响
基于ACM的网络明显优于基于常规ACM的网,尤其是随着网络的深入。结果表明,针对红外小目标检测,有必要定制网络下采样方案。否则,过度的下采样将导致深层中小目标特征的丢失。
在这里插入图片描述

2)双向注意调制的影响
单向自上而下的调制模块即图中所示的TopDownLocal,以及双向调制模块,如图7所示的BiLocal。BiLocal总是比TopDownLocal表现得更好,这表明最好使用双向注意力调制,而不是仅使用自上而下的调制。

在这里插入图片描述

3)不对称注意调制的影响
通道注意力尺度为局部(BiLocal)或全局的调制方案(BiGlobal)相,ACM模块在自上而下的路径中利用全局通道注意力,并在自下而上的路径中明智地指向局部通道注意力。结果验证了所提出的非对称调制的假设,即自上而下的调制需要全局通道注意模块来处理整个图像的高级语义信息,而自下而上的调制需要逐点通道注意机制来处理低级细节。

相关文章:

【CVPR红外小目标检测】红外小目标检测中的非对称上下文调制(ACM)

论文题目: Asymmetric Contextual Modulation for Infrared Small Target Detection 红外小目标检测中的非对称上下文调制 红外小目标数据集 目标个数分布:约90%图片中只有一个目标,约10%图片有多个目标(在稀疏/显著的方法中&am…...

Axios概述

一、Json-server 获得零编码的完整伪造 REST API zero coding 在不到 30 秒的时间内 &#xff08;认真&#xff09;。 使用 <3 创建&#xff0c;适用于需要快速后端进行原型设计和模拟的前端开发人员&#xff0c;模拟后端发送过来json数据。 1.安装 npm install -g jso…...

用右雅克比对旋转矩阵进行求导

考虑一个向量 a \bold{a} a对其进行旋转, 旋转用旋转矩阵 R \bold{R} R表示, 用朴素的倒数定义进行求导而不是用扰动模型, 我得到了这个过程与结果 和高博的新书结果 − R J r a ∧ -\bold{R}\bold{J}_{r}\bold{a}^{\wedge} −RJr​a∧结果不一样, 雅克比矩阵位置不同, 是不是…...

高性能HMI 走向扁平化

个人计算机作为图形用户界面&#xff08;GUI&#xff09;在自动化中已经使用了30多年。在那段时间里&#xff0c;从技术、术语、功能到用于创建接口的标准和指南&#xff0c;发生了许多变化。 PC 技术的飞速发展&#xff0c;特别是图形显示&#xff0c;用户界面的技术发展导致了…...

虚幻引擎配置物体水面浮力的简便方法

虚幻引擎配置物体水面浮力的简便方法 目录 虚幻引擎配置物体水面浮力的简便方法前言前期工作配置水面浮力针对一个立方体的水面浮力配置针对船3D模型的水面浮力配置 小结 前言 在使用虚幻引擎配置导入的3D模型时&#xff0c;如何快速地将水面浮力配置正确&#xff0c;从而使得…...

WatchGuard 防火墙策略、配置和日志分析器

获取 Internet 活动见解并及时了解安全事件是一项具有挑战性的任务&#xff0c;因为安全设备会生成大量的安全和流量日志。Firewall Analyzer 针对 WatchGuard 防火墙设备的报告功能具有一系列功能&#xff0c;使您能够增强网络安全。WatchGuard 日志分析器软件&#xff0c;可让…...

Web自动化测试——XAPTH高级定位

XAPTH高级定位 一、xpath 基本概念二、xpath 使用场景三、xpath 相对定位的优点四、xpath 定位的调试方法五、xpath 基础语法&#xff08;包含关系&#xff09;六、xpath 顺序关系&#xff08;索引&#xff09;七、xpath 高级用法1、[last()]: 选取最后一个2、[属性名属性值 an…...

CentOS 7 安装 Nginx

前言 最近&#xff0c;在公司经常会进行项目的部署&#xff0c;但是服务器环境都是导师已经搭建好了的&#xff0c;我就是将项目文件放到特定目录。于是&#xff0c;周末在家就进行了 Nginx 的安装学习。之前&#xff0c;在 Windows 上使用过 Nginx&#xff0c;但是在 Linux 环…...

Databend 开源周报第 91 期

Databend 是一款现代云数仓。专为弹性和高效设计&#xff0c;为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务&#xff1a;https://app.databend.cn 。 Whats On In Databend 探索 Databend 本周新进展&#xff0c;遇到更贴近你心意的 Databend 。 新数据类型&…...

【Ubuntu18.04使用yolov5教程】

欢迎大家阅读2345VOR的博客【Ubuntu18.04使用yolov5教程】&#x1f973;&#x1f973;&#x1f973;2345VOR鹏鹏主页&#xff1a; 已获得CSDN《嵌入式领域优质创作者》称号&#x1f47b;&#x1f47b;&#x1f47b;&#xff0c;座右铭&#xff1a;脚踏实地&#xff0c;仰望星空…...

CocoaPods如何发布新版本的Pod Library

当我们修改了一个Pod Library中的代码时&#xff0c;如何让依赖该库的项目能更新到最新代码&#xff0c;步骤如下&#xff1a; 假设现在修改了SamplePod&#xff08;Pod名称&#xff09;的代码&#xff0c;希望将最新版本更新到1.0.1&#xff0c;目前版本是1.0.0 修改SamplePo…...

v4l2框架

v4l2框架 文章目录 v4l2框架框架1.硬件相关层uvc_probeuvc_register_chainsuvc_register_termsuvc_register_video 2.核心层__video_register_device 3.虚拟视频驱动vivid分析入口vivid_init注册vivid平台驱动vivid_probevivid_create_instance 框架 1.硬件相关层 driver/medi…...

vue项目中生成LICENSE文件

vue项目中生成LICENSE文件 简介 LICENSE 文件是一个文本文件&#xff0c;它包含了你的项目所使用的开源软件的许可证信息。 在开发过程中&#xff0c;我们经常会使用到各种各样的第三方开源软件&#xff0c;这些软件是有版权和许可证的&#xff0c;我们在使用时需要遵循它们的…...

NewBing最新更新使用体验(无需等待人人可用)

NewBing最新更新使用体验 微软Bing爆炸级更新&#xff01;无需等待人人可用&#xff01; 今天&#xff0c;微软突然官宣全面开放BingChat&#xff1a; 无需任何等待。只需注册一个账户&#xff0c;首页即可体验。 NewBing最新更新新特性官方文档 https://www.microsoft.com/en-…...

欧拉奔赴品牌2.0时代,女性汽车真实用户需求被定义?

每年的上海国际汽车工业展览会&#xff0c;不仅是各大汽车品牌的技术“秀场”&#xff0c;也是品牌的营销“修罗场”。今年上海车展出圈的营销事件特别多&#xff0c;热度甚至一再蔓延到汽车行业外&#xff0c;其中欧拉也贡献了不少流量。 据了解&#xff0c;在2023上海车展欧…...

机器视觉工程师,听我一句劝,别去外包,干了三年,废了....对女人没了兴趣

​外包三年,干了就废,最后只会安装软件。 对于年轻人来说,需要工作,更需要生活。 对于年轻人来说,需要努力,更需要“面包”。 对于年轻人来说,需要规划,更需要发展。 对于外包,虽说废的不是很彻底,但那三年几乎是出差了三年、玩了三年、荒废了三年,那三年,技术…...

PBDB Data Service:Special parameters(特殊参数)

Special parameters&#xff08;特殊参数&#xff09; 描述参数1&#xff1a;下列参数在大部分请求中可用2&#xff1a;以下参数只与文本格式(.csv&#xff0c; .tsv&#xff0c; .txt)相关 描述 本文将介绍一组特殊参数&#xff0c;它们几乎可以在此数据服务的任何请求中使用…...

腾讯云轻量应用服务器使用限制说明(十大限制)

腾讯云轻量应用服务器和云服务器CVM相比具有一些限制&#xff0c;比如轻量服务器不支持更换内网IP地址&#xff0c;轻量服务器只能套餐整体升级且不支持降配&#xff0c;轻量不支持用户自定义配置私有网络VPC&#xff0c;还有如实例配额、云硬盘配额、备案限制和内网连通性等限…...

Python每日一练(20230507) 丑数I\II\III、超级丑数

目录 1. 丑数 Ugly Number I 2. 丑数 Ugly Number II 3. 丑数 Ugly Number III 4. 超级丑数 Super Ugly Number &#x1f31f; 每日一练刷题专栏 &#x1f31f; Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 Java每日一练 专栏 1. 丑数 Ugly Number I …...

K8S常见异常事件与解决方案

集群相关 Coredns容器或local-dns容器重启 集群中的coredns组件发生重启(重新创建)&#xff0c;一般是由于coredns组件压力较大导致oom&#xff0c;请检查业务是否异常&#xff0c;是否存在应用容器无法解析域名的异常。 如果是local-dns重启&#xff0c;说明local-dns的性能…...

DeepSeek 赋能智慧能源:微电网优化调度的智能革新路径

目录 一、智慧能源微电网优化调度概述1.1 智慧能源微电网概念1.2 优化调度的重要性1.3 目前面临的挑战 二、DeepSeek 技术探秘2.1 DeepSeek 技术原理2.2 DeepSeek 独特优势2.3 DeepSeek 在 AI 领域地位 三、DeepSeek 在微电网优化调度中的应用剖析3.1 数据处理与分析3.2 预测与…...

MMaDA: Multimodal Large Diffusion Language Models

CODE &#xff1a; https://github.com/Gen-Verse/MMaDA Abstract 我们介绍了一种新型的多模态扩散基础模型MMaDA&#xff0c;它被设计用于在文本推理、多模态理解和文本到图像生成等不同领域实现卓越的性能。该方法的特点是三个关键创新:(i) MMaDA采用统一的扩散架构&#xf…...

【论文笔记】若干矿井粉尘检测算法概述

总的来说&#xff0c;传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度&#xff0c;通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...

镜像里切换为普通用户

如果你登录远程虚拟机默认就是 root 用户&#xff0c;但你不希望用 root 权限运行 ns-3&#xff08;这是对的&#xff0c;ns3 工具会拒绝 root&#xff09;&#xff0c;你可以按以下方法创建一个 非 root 用户账号 并切换到它运行 ns-3。 一次性解决方案&#xff1a;创建非 roo…...

C++ 基础特性深度解析

目录 引言 一、命名空间&#xff08;namespace&#xff09; C 中的命名空间​ 与 C 语言的对比​ 二、缺省参数​ C 中的缺省参数​ 与 C 语言的对比​ 三、引用&#xff08;reference&#xff09;​ C 中的引用​ 与 C 语言的对比​ 四、inline&#xff08;内联函数…...

2025盘古石杯决赛【手机取证】

前言 第三届盘古石杯国际电子数据取证大赛决赛 最后一题没有解出来&#xff0c;实在找不到&#xff0c;希望有大佬教一下我。 还有就会议时间&#xff0c;我感觉不是图片时间&#xff0c;因为在电脑看到是其他时间用老会议系统开的会。 手机取证 1、分析鸿蒙手机检材&#x…...

动态 Web 开发技术入门篇

一、HTTP 协议核心 1.1 HTTP 基础 协议全称 &#xff1a;HyperText Transfer Protocol&#xff08;超文本传输协议&#xff09; 默认端口 &#xff1a;HTTP 使用 80 端口&#xff0c;HTTPS 使用 443 端口。 请求方法 &#xff1a; GET &#xff1a;用于获取资源&#xff0c;…...

day36-多路IO复用

一、基本概念 &#xff08;服务器多客户端模型&#xff09; 定义&#xff1a;单线程或单进程同时监测若干个文件描述符是否可以执行IO操作的能力 作用&#xff1a;应用程序通常需要处理来自多条事件流中的事件&#xff0c;比如我现在用的电脑&#xff0c;需要同时处理键盘鼠标…...

Java并发编程实战 Day 11:并发设计模式

【Java并发编程实战 Day 11】并发设计模式 开篇 这是"Java并发编程实战"系列的第11天&#xff0c;今天我们聚焦于并发设计模式。并发设计模式是解决多线程环境下常见问题的经典解决方案&#xff0c;它们不仅提供了优雅的设计思路&#xff0c;还能显著提升系统的性能…...

【java面试】微服务篇

【java面试】微服务篇 一、总体框架二、Springcloud&#xff08;一&#xff09;Springcloud五大组件&#xff08;二&#xff09;服务注册和发现1、Eureka2、Nacos &#xff08;三&#xff09;负载均衡1、Ribbon负载均衡流程2、Ribbon负载均衡策略3、自定义负载均衡策略4、总结 …...