当前位置：首页 > news >正文

每日Attention学习7——Frequency-Perception Module

news 文章来源：https://blog.csdn.net/qq_40714949/article/details/140111148 2024/7/4 4:39:06

模块出处

[link] [code] [ACM MM 23] Frequency Perception Network for Camouflaged Object Detection

模块名称

Frequency-Perception Module (FPM)

模块作用

获取频域信息，更好识别伪装对象

模块结构

在这里插入图片描述

模块代码

import torch
import torch.nn as nn
import torch.nn.functional as Fclass FirstOctaveConv(nn.Module):def __init__(self, in_channels, out_channels, kernel_size, alpha=0.5, stride=1, padding=1, dilation=1,groups=1, bias=False):super(FirstOctaveConv, self).__init__()self.stride = stridekernel_size = kernel_size[0]self.h2g_pool = nn.AvgPool2d(kernel_size=(2, 2), stride=2)self.h2l = torch.nn.Conv2d(in_channels, int(alpha * in_channels),kernel_size, 1, padding, dilation, groups, bias)self.h2h = torch.nn.Conv2d(in_channels, in_channels - int(alpha * in_channels),kernel_size, 1, padding, dilation, groups, bias)def forward(self, x):if self.stride ==2:x = self.h2g_pool(x)X_h2l = self.h2g_pool(x)X_h = xX_h = self.h2h(X_h)X_l = self.h2l(X_h2l)return X_h, X_lclass OctaveConv(nn.Module):def __init__(self, in_channels, out_channels, kernel_size, alpha=0.5, stride=1, padding=1, dilation=1,groups=1, bias=False):super(OctaveConv, self).__init__()kernel_size = kernel_size[0]self.h2g_pool = nn.AvgPool2d(kernel_size=(2, 2), stride=2)self.upsample = torch.nn.Upsample(scale_factor=2, mode='nearest')self.stride = strideself.l2l = torch.nn.Conv2d(int(alpha * in_channels), int(alpha * out_channels),kernel_size, 1, padding, dilation, groups, bias)self.l2h = torch.nn.Conv2d(int(alpha * in_channels), out_channels - int(alpha * out_channels),kernel_size, 1, padding, dilation, groups, bias)self.h2l = torch.nn.Conv2d(in_channels - int(alpha * in_channels), int(alpha * out_channels),kernel_size, 1, padding, dilation, groups, bias)self.h2h = torch.nn.Conv2d(in_channels - int(alpha * in_channels),out_channels - int(alpha * out_channels),kernel_size, 1, padding, dilation, groups, bias)def forward(self, x):X_h, X_l = xif self.stride == 2:X_h, X_l = self.h2g_pool(X_h), self.h2g_pool(X_l)X_h2l = self.h2g_pool(X_h)X_h2h = self.h2h(X_h)X_l2h = self.l2h(X_l)X_l2l = self.l2l(X_l)X_h2l = self.h2l(X_h2l)X_l2h = F.interpolate(X_l2h, (int(X_h2h.size()[2]),int(X_h2h.size()[3])), mode='bilinear')X_h = X_l2h + X_h2hX_l = X_h2l + X_l2lreturn X_h, X_lclass LastOctaveConv(nn.Module):def __init__(self, in_channels, out_channels, kernel_size, alpha=0.5, stride=1, padding=1, dilation=1,groups=1, bias=False):super(LastOctaveConv, self).__init__()self.stride = stridekernel_size = kernel_size[0]self.h2g_pool = nn.AvgPool2d(kernel_size=(2, 2), stride=2)self.l2h = torch.nn.Conv2d(int(alpha * out_channels), out_channels,kernel_size, 1, padding, dilation, groups, bias)self.h2h = torch.nn.Conv2d(out_channels - int(alpha * out_channels),out_channels,kernel_size, 1, padding, dilation, groups, bias)self.upsample = torch.nn.Upsample(scale_factor=2, mode='nearest')def forward(self, x):X_h, X_l = xif self.stride == 2:X_h, X_l = self.h2g_pool(X_h), self.h2g_pool(X_l)X_h2h = self.h2h(X_h) X_l2h = self.l2h(X_l) X_l2h = F.interpolate(X_l2h, (int(X_h2h.size()[2]), int(X_h2h.size()[3])), mode='bilinear')X_h = X_h2h + X_l2h return X_hclass FPM(nn.Module):def __init__(self, in_channels, out_channels, kernel_size=(3, 3)):super(FPM, self).__init__()self.fir = FirstOctaveConv(in_channels, out_channels, kernel_size)self.mid1 = OctaveConv(in_channels, in_channels, kernel_size)self.mid2 = OctaveConv(in_channels, out_channels, kernel_size)self.lst = LastOctaveConv(in_channels, out_channels, kernel_size)def forward(self, x):x_h, x_l = self.fir(x)                  x_h_1, x_l_1 = self.mid1((x_h, x_l))     x_h_2, x_l_2 = self.mid1((x_h_1, x_l_1)) x_h_5, x_l_5 = self.mid2((x_h_2, x_l_2)) x_ret = self.lst((x_h_5, x_l_5))return x_retif __name__ == '__main__':x = torch.randn([3, 256, 16, 16])fpm = FPM(in_channels=256, out_channels=64)out = fpm(x)print(out.shape)  # 3, 64, 16, 16

原文表述

具体来说，我们采用八度卷积以端到端的方式自动感知高频和低频信息，从而实现伪装物体检测的在线学习。八度卷积可以有效避免DCT 引起的块状效应，并利用GPU的计算速度优势。此外，它可以轻松插入任意网络。

每日Attention学习7——Frequency-Perception Module

模块出处 [link] [code] [ACM MM 23] Frequency Perception Network for Camouflaged Object Detection 模块名称 Frequency-Perception Module (FPM) 模块作用获取频域信息，更好识别伪装对象模块结构模块代码 import torch import torch.nn as nn import to…...

编程日记 2024/7/1 23:34:40

【从0实现React18】 (五) 初探react mount流程完成核心递归流程

更新流程的目的： 生成wip fiberNode树标记副作用flags 更新流程的步骤： 递：beginWork归：completeWork 在上一节 ，我们探讨了 React 应用在首次渲染或后续更新时的整体更新流程。在 Reconciler 工作流程中&#xff…...

编程日记 2024/7/1 23:33:40

0-30 VDC 稳压电源，电流控制 0.002-3 A

怎么运行的首先，有一个次级绕组额定值为 24 V/3 A 的降压电源变压器，连接在电路输入点的引脚 1 和 2 上。（电源输出的质量将直接影响与变压器的质量成正比）。变压器次级绕组的交流电压经四个二极管D1-D4组成的电桥整流。桥输出端…...

编程日记 2024/7/1 23:32:38

HTML5+CSS3+JS小实例：图片九宫格

实例：图片九宫格技术栈：HTML+CSS+JS 效果：源码：【HTML】 <!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1…...

编程日记 2024/7/1 23:31:37

湘潭大学软件工程数据库总结

文章目录前言试卷结构给学弟学妹的一些参考自己的一些总结前言自己可能很早很早之前就准备复习了，但是感觉还是没有学到要点，主要还是没啥紧迫的压力，我们是三月份开学，那时候实验室有朋友挺认真开始学习数据库了，…...

编程日记 2024/7/1 23:30:36

Codeforces Testing Round 1 B. Right Triangles 题解组合数学

Right Triangles 题目描述 You are given a n m nm nm field consisting only of periods (‘.’) and asterisks (‘*’). Your task is to count all right triangles with two sides parallel to the square sides, whose vertices are in the centers of ‘*’-cells. …...

编程日记 2024/7/1 23:29:35

怎样将word默认Microsoft Office，而不是WPS

设置——>应用——>默认应用——>选择"word"——>将doc和docx都选择Microsoft Word即可...

编程日记 2024/7/1 23:28:34

C语言之进程的学习2

Env环境变量（操作系统的全局变量）...

编程日记 2024/7/1 23:26:30

web使用cordova打包Andriod

一.安装Gradel 1.下载地址 Gradle Distributions 2.配置环境 3.测试是否安装成功在cmd gradle -v 二.创建vite项目 npm init vitelatest npm install vite build 三.创建cordova项目 1.全局安装cordova npm install -g cordova 2. 创建项目 cordova create cordova-app c…...

编程日记 2024/7/1 23:25:29

内卷情况下，工程师也应该了解的项目管理

简介：大家好，我是程序员枫哥，🌟一线互联网的IT民工、📝资深面试官、🌹Java跳槽网创始人。拥有多年一线研发经验，曾就职过科大讯飞、美团网、平安等公司。在上海有自己小伙伴组建的副业团队&…...

编程日记 2024/7/1 23:24:27

【解锁未来：深入了解机器学习的核心技术与实际应用】

解锁未来：深入了解机器学习的核心技术与实际应用 💎1.引言💎1.1 什么是机器学习？ 💎2 机器学习的分类💎3 常用的机器学习算法💎3.1 线性回归（Linear Regression）&#x1…...

编程日记 2024/7/1 23:23:25

1-3.文本数据建模流程范例

文章最前： 我是Octopus，这个名字来源于我的中文名–章鱼；我热爱编程、热爱算法、热爱开源。所有源码在我的个人github ；这博客是记录我学习的点点滴滴，如果您对 Python、Java、AI、算法有兴趣，可以关注我的…...

编程日记 2024/7/1 23:22:24

【FFmpeg】avformat_alloc_output_context2函数

【FFmpeg】avformat_alloc_output_context2函数 1.avformat_alloc_output_context21.1 初始化AVFormatContext（avformat_alloc_context）1.2 格式猜测（av_guess_format）1.2.1 遍历可用的fmt（av_muxer_iterate&#xff0…...

编程日记 2024/7/1 23:20:21

Flask 缓存和信号

Flask-Caching Flask-Caching 是 Flask 的一个扩展，它为 Flask 应用提供了缓存支持。缓存是一种优化技术，可以存储那些费时且不经常改变的运算结果，从而加快应用的响应速度。一、初始化配置安装 Flask-Caching 扩展： pip3 i…...

编程日记 2024/7/1 23:19:20

基于weixin小程序农场驿站系统的设计

管理员账户功能包括：系统首页，个人中心，农场资讯管理，用户管理，卖家管理，用户分享管理，分享类型管理，商品信息管理，商品类型管理开发系统：Windows 架构模式…...

编程日记 2024/7/1 23:16:16

JAVA将List转成Tree树形结构数据和深度优先遍历

引言： 在日常开发中，我们经常会遇到需要将数据库中返回的数据转成树形结构的数据返回，或者需要对转为树结构后的数据绑定层级关系再返回，比如需要统计当前节点下有多少个节点等，因此我们需要封装一个ListToTree的工具类…...

编程日记 2024/7/1 23:14:14

设计模式——开闭、单一职责及里氏替换原则

设计原则是指导软件设计和开发的一系列原则，它们帮助开发者创建出易于维护、扩展和理解的代码。以下是你提到的几个关键设计原则的简要说明： 开闭原则（Open/Closed Principle, OCP）： 开闭原则由Bertrand Meyer提出&am…...

编程日记 2024/7/1 23:13:12

代码随想录算法训练营第59天：动态[1]

代码随想录算法训练营第59天：动态两个字符串的删除操作力扣题目链接(opens new window) 给定两个单词 word1 和 word2，找到使得 word1 和 word2 相同所需的最小步数，每步可以删除任意一个字符串中的一个字符。示例： 输入: …...

编程日记 2024/7/1 23:11:09

jvm性能监控常用工具

在java的/bin目录下有许多java自带的工具。我们常用的有基础工具 jar:创建和管理jar文件 java：java运行工具，用于运行class文件或jar文件 javac：java的编译器 javadoc：java的API文档生成工具性能监控和故障处理 jps jstat…...

编程日记 2024/7/1 23:10:07

ISP IC/FPGA设计-第一部分-SC130GS摄像头分析-IIC通信（1）

1.摄像头模组 SC130GS通过一个引脚（SPI_I2C_MODE）选择使用IIC或SPI配置接口，通过查看摄像头模组的原理图，可知是使用IIC接口； 通过手册可知IIC设备地址通过一个引脚控制，查看摄像头模组的原理图&#xff…...

编程日记 2024/7/1 23:09:06

HTTP协议头中X-Forwarded-For是能做什么?

X-Forwarded-For和相关几个头部的理解 $remote_addr 是nginx与客户端进行TCP连接过程中，获得的客户端真实地址. Remote Address 无法伪造，因为建立 TCP 连接需要三次握手，如果伪造了源 IP，无法建立 TCP 连接，更不会有后…...

编程日记 2024/7/1 23:07:04

Linux高并发服务器开发（八）Socket和TCP

文章目录 1 IPV4套接字结构体2 TCP客户端函数 3 TCP服务器流程函数代码粘包 4 三次握手5 四次挥手6 滑动窗口 1 IPV4套接字结构体 2 TCP客户端特点：出错重传每次发送数据对方都会回ACK，可靠 tcp是打电话的模型，建立连接使用连接关闭连接…...

编程日记 2024/7/1 23:06:02

力扣第220题“存在重复元素 III”

在本篇文章中，我们将详细解读力扣第220题“存在重复元素 III”。通过学习本篇文章，读者将掌握如何使用桶排序和滑动窗口来解决这一问题，并了解相关的复杂度分析和模拟面试问答。每种方法都将配以详细的解释，以便于理解。问题描述…...

编程日记 2024/7/1 23:05:00

Qt实战项目——贪吃蛇

一、项目介绍本项目是一个使用Qt框架开发的经典贪吃蛇游戏，旨在通过简单易懂的游戏机制和精美的用户界面，为玩家提供娱乐和编程学习的机会。游戏展示二、主要功能 2.1 游戏界面游戏主要是由三个界面构成，分别是游戏大厅、难度选择和游戏…...

编程日记 2024/7/1 23:03:58

Windows 10,11 Server 2022 Install Docker-Desktop

docker 前言 Docker 是一个开源的应用容器引擎，让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中，然后发布到任何流行的 Linux或Windows 机器上，也可以实现虚拟化。容器是完全使用沙箱机制，相互之间不会有任何接口。 docker-compose Compose 是用于定义和运行…...

编程日记 2024/7/1 23:00:54

C++中的RAII（资源获取即初始化）原则

C中的RAII（Resource Acquisition Is Initialization，资源获取即初始化）原则是一种管理资源、避免资源泄漏的惯用法。RAII是C之父Bjarne Stroustrup提出的设计理念，其核心思想是将资源的获取（如动态内存分配、文件句柄、…...

编程日记 2024/7/1 22:59:53

【机器学习】Whisper：开源语音转文本（speech-to-text）大模型实战

目录一、引言二、Whisper 模型原理 2.1 模型架构 2.2 语音处理 2.3 文本处理三、Whisper 模型实战 3.1 环境安装 3.2 模型下载 3.3 模型推理 3.4 完整代码 3.5 模型部署四、总结一、引言上一篇对ChatTTS文本转语音模型原理和实战进行了讲解&a…...

编程日记 2024/7/1 22:58:52

ubuntu22.04 编译安装openssl C++ library

#--------------------------------------------------------------------------- # openssl C library # https://www.openssl.org/source/index.html #--------------------------------------------------------------------------- cd /opt/download # 下载openssl-3.0.13…...

编程日记 2024/7/1 22:57:51

百度Agent初体验（制作步骤+感想）

现在AI Agent很火，最近注册了一个百度Agent体验了一下，并做了个小实验，拿它和零一万物（Yi Large）和文心一言（ERNIE-4.0-8K-latest）阅读了相同的一篇网页资讯，输出资讯摘要&#xff0…...

编程日记 2024/7/1 22:54:47

7-491 3名同学5门课程成绩，输出最好成绩及所在的行和列（二维数组作为函数的参数）

编程:数组存储3名同学5门课程成绩输出最好成绩及所在的行和列要求：将输入、查找和打印的功能编写成函数并将二维数组通过指针参数传递的方式由主函数传递到子函数中输入格式: 每行输入一个同学的5门课的成绩，每个成绩之间空一格，见输入…...

编程日记 2024/7/1 22:53:46

OpenCloudOS开源的操作系统

OpenCloudOS 是一款开源的操作系统，致力于提供高性能、稳定和安全的操作系统环境，以满足现代计算和应用程序的需求。它结合了现代操作系统设计的最新技术和实践，为开发者和企业提供了一个强大的平台。本文将详细介绍 OpenCloudOS 的背景、特性…...

编程日记 2024/7/1 22:51:43

排序题目：多数元素 II

文章目录题目标题和出处难度题目描述要求示例数据范围进阶前言解法一思路和算法代码复杂度分析解法二思路和算法代码复杂度分析解法三思路和算法代码复杂度分析题目标题和出处标题：多数元素 II 出处：229. 多数元素 II 难度 3 级题目描述 …...

编程日记 2024/7/1 22:49:40

＜电力行业＞ - 《第1课：电力行业的五大四小》

1 什么是电力行业的五大四小？ 我们常说的电力行业的五大四小，指的是电力行业有实力的公司，分为：较强梯队的五大集团、较弱梯队的四小豪门。五个实力雄厚的集团，分别是： 中国华能集团公司中国大唐集团公…...

编程日记 2024/7/1 22:48:39

数据库定义语言（DDL）

数据库定义语言（DDL） 一、数据库操作 1、查询所有的数据库 SHOW DATABASES;效果截图： 2、使用指定的数据库 use 2403 2403javaee;效果截图： 3、创建数据库 CREATE DATABASE 2404javaee;效果截图： 4、删除数据…...

编程日记 2024/7/1 22:46:35

mybatis实现多表查询

mybatis高级查询【掌握】 1、准备工作【1】包结构创建java项目，导入jar包和log4j日志配置文件以及连接数据库的配置文件； 【2】导入SQL脚本运行资料中的sql脚本：mybatis.sql 【3】创建实体来包，导入资料中的pojo 【4】User…...

编程日记 2024/7/1 22:45:34

数据结构：队列详解 c++信息学奥赛基础知识讲解

目录一、队列概念二、队列容器三、队列操作四、代码实操五、队列遍历六、案例实操题目描述： 输入格式： 输出格式： 输入样例： 输出样例： 详细代码： 一、队列概念队列是一种特殊的线性…...

编程日记 2024/7/1 22:44:30

硬件开发笔记（二十三）：贴片电阻的类别、封装介绍，AD21导入贴片电阻原理图封装库3D模型

若该文为原创文章，转载请注明原文出处本文章博客地址：https://hpzwl.blog.csdn.net/article/details/140110514 长沙红胖子Qt（长沙创微智科）博文大全：开发技术集合（包含Qt实用技术、树莓派、三维、OpenCV…...

编程日记 2024/7/1 22:42:22

Kafka基本原理详解

（一）概念理解 Apache Kafka是一种开源的分布式流处理平台，专为高性能、高吞吐量的实时数据处理而设计。它最初由LinkedIn公司开发，旨在解决其网站活动中产生的大量实时数据处理和传输问题，后来于2011年开源&#xff0…...

编程日记 2024/7/1 22:41:21

【Unity】RPG2D龙城纷争（七）关卡编辑器之剧情编辑

更新日期：2024年7月1日。项目源码：第五章发布（正式开始游戏逻辑的章节）索引简介一、剧情编辑1.对话数据集2.对话触发方式3.选择对话角色4.设置对话到关卡5.通关条件简介严格来说，剧情编辑不在关卡编辑器界面中完成，只不过它仍然属于关卡编辑的范畴。在我们的设想中…...

编程日记 2024/7/1 22:35:14

uniapp启动页面鉴权页面闪烁问题

在使用uni-app开发app 打包完成后如果没有token，那么就在onLaunch生命周期里面判断用户是否登录并跳转至登录页。但是在app中页面会先进入首页然后再跳转至登录页，十分影响体验。处理方法： 使用plus.navigator.closeSplashscreen() 官网…...

编程日记 2024/7/1 22:32:11

全志H616交叉编译工具链的安装与使用

交叉编译的概念 1. 什么是交叉编译？ 交叉编译是指在一个平台上生成可以在另一个平台上运行的可执行代码。例如，在Ubuntu Linux上编写代码，并编译生成可在Orange Pi Zero2上运行的可执行文件。这个过程是通过使用一个专门的交叉编译工具链来…...

编程日记 2024/7/1 22:29:07

深入解析Java和Go语言中String与byte数组的转换原理

1.Java String与byte[]互相转换存在的问题 java中，按照byte[] 》string 》byte[]的流程转换后，byte数据与最初的byte不一致。多说无益，上代码，本地macos机器执行，统一使用的UTF-8编码。 import java.nio.charset.S…...

编程日记 2024/7/1 22:28:06

什么是strcmp函数

目录开头1.什么是strcmp函数2.strcmp函数里的内部结构3.strcmp函数的实际运用(这里只列举其一)脑筋急转弯结尾开头大家好，我叫这是我58。今天，我们要来认识一下C语言中的strcmp函数。 1.什么是strcmp函数 strcmp函数来自于C语言中的头文件<str…...

编程日记 2024/7/1 22:27:05

Follow Carl To Grow|【LeetCode】491.递增子序列，46.全排列，47.全排列 II

【LeetCode】491.递增子序列题意：给你一个整数数组 nums ，找出并返回所有该数组中不同的递增子序列，递增子序列中至少有两个元素。你可以按任意顺序返回答案。数组中可能含有重复元素，如出现两个整数相等，也可以…...

编程日记 2024/7/1 22:25:02

pytorch nn.Embedding 用法和原理

nn.Embedding 是 PyTorch 中的一个模块，用于将离散的输入（通常是词或子词的索引）映射到连续的向量空间。它在自然语言处理和其他需要处理离散输入的任务中非常常用。以下是 nn.Embedding 的用法和原理。用法初始化 nn.Embedding nn.Embed…...

编程日记 2024/7/1 22:24:00

Python中常用的有7种值（数据）的类型及type()语句的用法

目录 0.Python中常用的有7种值（数据）的类型Python中的数据类型主要有：Number（数字）、Boolean（布尔）、String（字符串）、List（列表）、Tuple&#xf…...

编程日记 2024/7/1 22:22:58

某配送平台未授权访问和弱口令（附赠nuclei默认密码验证脚本）

找到一个某src的子站，通过信息收集插件，发现ZABBIX-监控系统，可以日一下使用谷歌搜索历史漏洞：zabbix漏洞通过目录扫描扫描到后台，谷歌搜索一下有没有默认弱口令成功进去了，挖洞就是这么简单搜索文章还…...

编程日记 2024/7/1 22:21:56

01.总览

目录简介Course 1: Natural Language Processing with Classification and Vector SpaceWeek 1: Sentiment Analysis with Logistic RegressionWeek 2: Sentiment Analysis with Nave BayesWeek 3: Vector Space ModelsWeek 4: Machine Translation and Document Search Cours…...

编程日记 2024/7/1 22:20:54