当前位置：首页 > news >正文

DiffIR: Efficient Diffusion Model for Image Restoration

news 2025/7/13 15:46:03

清华&ETH&字节&UTD
https://github.com/Zj-BinXia/DiffIR

问题引入

IR任务和image synthesis任务不同点是IR任务本身有一个很强的低质量图片作为先验，所以可以不完全遵循图片生成的范式，本文主要在compact的IPR空间进行DM；
本文提出的模型分为三个部分，1)CPEN(compact IR prior extraction network)来得到IPR(IR prior representation)，这个作为回归模型的指导信息；2)DIRformer回归模型，类比为decoder；3)DM来通过LQ图片得到IPR
训练分为两个stage，首先第一个stage训练CPEN和DIRformer，此时CPEN输入的是高质量图片；第二个stage使用的IPR是DM得到的；

methods

在这里插入图片描述

stage1: 训练CPEN和DIRformer，首先将gt和LQ concat到一起，然后经过pixelunshuffle得到CPEN的输入，输出IPR $CPEN_{S1}(PixelUnshuffle(Concat(I_{GT},I_{LQ}))),Z\in\mathbb{R}^{4C'}$ ，之后IPR被送到DIRformer的DGFN和DMTA模块，第一阶段训练的损失是GT和生成HQ的L1损失，超分和inpainting任务还有erceptual loss and adversarial
loss；
DMTA的操作 $W_l^1Z\odot Norm(F) + W_l^2 Z$ ，其中 $W_l$ 是linear层， $F, F^{'}$ 分别是输入和输出的feature map， $Q = W_d^QW_c^QF',K=W_d^KW_c^KF',V = W_d^VW_c^VF'$ ，其中 $W_d$ 是depthwise卷积， $W_c$ 是pointwise卷积，之后被reshape成 $\widehat{Q}\in\mathbb{R}^{\widehat{H}\widehat{W}\times\widehat{C}},\widehat{K}\in\mathbb{R}^{\widehat{C}\times\widehat{H}\widehat{W}},\widehat{V}\in\mathbb{R}^{\widehat{H}\widehat{W}\times\widehat{C}}$ ，最后 $\widehat{F}=W_c\widehat{V}\cdot Softmax(\widehat{K}\cdot \widehat{Q}/\gamma)+F$ ；
DGFN的操作： $\widehat{F}=GELU(W_d^1W_c^1F')\odot W^2_dW_c^2F' + F$ ；
stage2：同时训练三个部分，首先使用 $CPEN_{S1}$ 得到 $Z$ ，之后经过diffusion process得到 $Z_T\in\mathbb{R}^{4C'}$ ， $CPEN_{S2}$ 得到 $D = CPEN_{S2}(PixelUnshuffle(I_{LQ}))$ ，之后进行DM，以D为条件，进行去噪t-1次得到 $\widehat{Z}$ ，和 $CPEN_{S1}$ 得到的 $Z$ 计算损失 $L_{diff} = \frac{1}{4C'}\sum_{i = 1}^{4C'}|\widehat{Z}(i) - Z(i)|$ ，这损失和stage1的损失在一起计算总损失；

实验

DiffIR: Efficient Diffusion Model for Image Restoration

清华&ETH&字节&UTDhttps://github.com/Zj-BinXia/DiffIR 问题引入 IR任务和image synthesis任务不同点是IR任务本身有一个很强的低质量图片作为先验，所以可以不完全遵循图片生成的范式，本文主要在compact的IPR空间进行DM；本文提…...

编程日记 2024/6/20 0:39:48

xss一些笔记

（乱写的一些笔记） innerHTML只防script像是img就不会防 innerText都防上面代码执行避免用户交互 js也可以用’‘执行例子 alert’1‘ document.location.hash // #号后的部分，包括#号 document.location.host // 域名…...

编程日记 2024/6/20 0:38:47

以太坊网络中为什么要设置Gas上限

以太坊网络中的Gas上限（Gas Limit）是一个重要的机制，它主要出于以下几个目的： 防止无限循环和拒绝服务攻击（DoS）： Gas上限防止了智能合约中的无限循环，这可以保护网络免受恶意合约的…...

编程日记 2024/6/20 0:36:44

vue-cli是什么？和 webpack是什么关系？

前言 Vue CLI是Vue.js项目的官方脚手架，基于Node.js与Webpack构建。安装Vue CLI前需确保Node.js已安装，随后通过npm全局安装。Vue CLI能迅速创建和管理Vue.js项目，提升开发效率。而Webpack则负责资源打包，通过配置文件管理依赖、插…...

编程日记 2024/6/20 0:34:42

leetcode刷题(46-50)

算法是码农的基本功，也是各个大厂必考察的重点，让我们一起坚持写题吧。遇事不决，可问春风，春风不语，即是本心。我们在我们能力范围内，做好我们该做的事，然后相信一切都事最好的安排就可以啦…...

编程日记 2024/6/20 0:33:41

Runner-HackTheBox 信息搜集 nmap扫描端口 nmap -sV -v 10.10.11.13扫描结果如下 PORT STATE SERVICE VERSION 22/tcp open ssh OpenSSH 8.9p1 Ubuntu 3ubuntu0.6 (Ubuntu Linux; protocol 2.0) 80/tcp open http nginx 1.18.0 (Ubuntu) 8000…...

编程日记 2024/6/20 0:32:39

keil5显示内存和存储占用百分比进度条工具

简介 [Keil5_disp_size_bar] 以进度条百分比来显示keil编译后生成的固件对芯片的内存ram和存储flash的占用情况, 并生成各个源码文件对ram和flash的占比整合排序后的map信息的表格和饼图。原理是使用C语言遍历当前目录找到keil工程和编译后生成的map文件然后读取工程文件和m…...

编程日记 2024/6/20 0:31:37

示例:推荐一个应用Adorner做的消息对话框

一、目的：开发过程中，经常用到对话框，下面演示一个应用Adorner做的带遮盖层蒙版的控件，使用MainWindow的Adorner实现不需要额外定义遮盖层，使用Object作为参数，可自定义DataTemplate定制消息显示样式二、效…...

编程日记 2024/6/20 0:29:34

Building wheels for collected packages: mmcv, mmcv-full 卡住

安装 anime-face-detector 的时候遇到一个问题：Installation takes forever #1386：在构建mmcv-full时卡住，这里分享下解决方法（安装 mmcv 同理，将下面命令中的 mmcv-full 替换成 mmcv） 具体表现如下&#x…...

编程日记 2024/6/20 0:28:33

可视化表单拖拽生成器优势多助力流程化办公！

当前，很多企业需要实现流程化办公，进入数字化转型时期。要想实现这一目标，就需要借助更优质的平台产品。低代码技术平台是得到企业喜爱的发展平台，拥有可视化操作、灵活、高效、更可靠等优势特点，在推动企业实现流程化…...

编程日记 2024/6/20 0:26:29

数据集制作——语义分割前png、jpg格式标签图转yolo格式.txt文件（附代码）

💪 专业从事且热爱图像处理，图像处理专栏更新如下👇： 📝《图像去噪》 📝《超分辨率重建》 📝《语义分割》 📝《风格迁移》 📝《目标检测》 📝《暗光增强》 &a…...

编程日记 2024/6/20 0:23:26

机器学习课程复习——ANN

Q：ANN？ 基本架构由输入层、隐藏层、输出层等构建前馈/反馈传播工作原理先加权求和：每个神经元的输出是输入加权和的激活再送入激活函数：激活函数的存在使得其能够拟合各类非线性任务联想：像adaboosting的加权求…...

编程日记 2024/6/20 0:22:24

C++回溯算法(2)

棋盘问题 #include<bits/stdc.h> using namespace std; void func(int,int); bool tf(int,int); void c(); int n,k; char a[110][110]; int cnt20; int main() {cin>>n>>k;for(int i0;i<n;i){for(int j0;j<n;j){cin>>a[i][j];}}func(0,0);cout…...

编程日记 2024/6/20 0:20:22

流量有限、日活低的APP适合对接广告变现吗？

APP广告变现，总用户数和日活用户（DUA）是衡量APP价值和影响力的重要指标之一。 APP DUA过万，尤其是大几万时，通常具备了商业化价值，适合接入广告变现。日活1W意味着每天有1万名用户在使用这款应用&#xff…...

编程日记 2024/6/20 0:19:20

Shell 学习笔记 - 变量的类型 + 变量的赋值

1.6 Shell 变量的类型 Shell 变量分为四类，分别是自定义变量环境变量位置变量预定义变量根据工作要求临时定义的变量称为自定义变量； 环境变量一般是指用 export 内置命令导出的变量，用于定义 Shell 的运行环境，保证 Shell …...

编程日记 2024/6/20 0:17:18

vue播放flv格式的直播流

在ios无法播放，安卓可以安装 npm install flv.js --save页面 <template><div><videoref"videoElement"style"width: 100%; height: 100%"autoplayplaysinlinemuted></video></div> </template><scr…...

编程日记 2024/6/20 0:16:17

Qt入门小项目 | 实现一个图片查看器

文章目录一、实现一个图片查看软件一、实现一个图片查看软件需要实现的功能： 打开目录选择图片显示图片的名字显示图片在以上功能的基础上进行优化，需要解决如下问题： 如何记住上次打开的路径？ 将路径保存到配置文件中&#x…...

编程日记 2024/6/20 0:13:13

qt仿制qq登录界面

#include "mainwindow.h"MainWindow::MainWindow(QWidget *parent): QMainWindow(parent) {// 设置窗口大小this->resize(window_width, window_heigth);// 固定窗口大小this->setFixedSize(window_width, window_heigth);// 设置窗口图标this->se…...

编程日记 2024/6/20 0:12:12

HashMap详解(含动画演示)

目录 HashMap1、HashMap的继承体系2、HashMap底层数据结构3、HashMap的构造函数①、无参构造②、有参构造1 和有参构造2 (可以自定义初始容量和负载因子)③、有参构造3(接受一个Map参数)JDK 8之前版本的哈希方法：JDK 8版本的哈希方法 4、拉链法解决哈希冲突什么是拉…...

编程日记 2024/6/20 0:11:10

TVS的原理及选型

目录案例描述 TVS管的功能与作用： TVS选型注意事项： 高速TVS管选型最近项目中遇到TVS管选型错误的问题。在此对TVS的功能及选型做一个分享。案例描述项目中保护指标应为4-14V，而选型的TVS管位SMJ40CA，其保护电压为40V未…...

编程日记 2024/6/20 0:10:08

业务系统对接大模型的基础方案：架构设计与关键步骤

业务系统对接大模型：架构设计与关键步骤在当今数字化转型的浪潮中，大语言模型（LLM）已成为企业提升业务效率和创新能力的关键技术之一。将大模型集成到业务系统中，不仅可以优化用户体验，还能为业务决策提供…...

编程新知 2025/7/11 7:29:15

SkyWalking 10.2.0 SWCK 配置过程

SkyWalking 10.2.0 & SWCK 配置过程 skywalking oap-server & ui 使用Docker安装在K8S集群以外，K8S集群中的微服务使用initContainer按命名空间将skywalking-java-agent注入到业务容器中。 SWCK有整套的解决方案，全安装在K8S群集中。具体可参…...

编程新知 2025/6/15 20:37:19

论文解读：交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（二）

HoST框架核心实现方法详解 - 论文深度解读（第二部分）《Learning Humanoid Standing-up Control across Diverse Postures》系列文章：论文深度解读 + 算法与代码分析（二）作者机构：上海AI Lab, 上海交通大学, 香港大学, 浙江大学, 香港中文大学论文主题：人形机器人…...

编程新知 2025/6/17 5:29:50

脑机新手指南（八）：OpenBCI_GUI：从环境搭建到数据可视化（下）

一、数据处理与分析实战 （一）实时滤波与参数调整基础滤波操作 60Hz 工频滤波：勾选界面右侧 “60Hz” 复选框，可有效抑制电网干扰（适用于北美地区，欧洲用户可调整为 50Hz）。平滑处理&…...

编程新知 2025/7/8 9:04:09

树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频

使用rpicam-app通过网络流式传输视频使用 rpicam-app 通过网络流式传输视频UDPTCPRTSPlibavGStreamerRTPlibcamerasrc GStreamer 元素文章来源： http://raspberry.dns8844.cn/documentation 原文网址使用 rpicam-app 通过网络流式传输视频本节介绍来自 rpica…...

编程新知 2025/6/15 22:22:18

Cesium1.95中高性能加载1500个点

一、基本方式： 图标使用.png比.svg性能要好 <template><div id"cesiumContainer"></div><div class"toolbar"><button id"resetButton">重新生成点</button><span id"countDisplay&qu…...

编程新知 2025/7/8 4:49:22

2025 后端自学UNIAPP【项目实战：旅游项目】6、我的收藏页面

代码框架视图 1、先添加一个获取收藏景点的列表请求【在文件my_api.js文件中添加】 // 引入公共的请求封装 import http from ./my_http.js// 登录接口（适配服务端返回 Token） export const login async (code, avatar) > {const res await http…...

编程新知 2025/7/11 0:43:16

鱼香ros docker配置镜像报错：https://registry-1.docker.io/v2/

使用鱼香ros一件安装docker时的https://registry-1.docker.io/v2/问题一键安装指令 wget http://fishros.com/install -O fishros && . fishros出现问题：docker pull 失败网络不同，需要使用镜像源按照如下步骤操作 sudo vi /etc/docker/dae…...

编程新知 2025/7/8 7:13:34

Java 二维码

Java 二维码 **技术：**谷歌 ZXing 实现首先添加依赖 <dependency><groupId>com.google.zxing</groupId><artifactId>core</artifactId><version>3.5.1</version></dependency><de…...

编程新知 2025/6/21 12:56:10

Java编程之桥接模式

定义桥接模式（Bridge Pattern）属于结构型设计模式，它的核心意图是将抽象部分与实现部分分离，使它们可以独立地变化。这种模式通过组合关系来替代继承关系，从而降低了抽象和实现这两个可变维度之间的耦合度。用例子…...

编程新知 2025/6/17 3:19:01

DiffIR: Efficient Diffusion Model for Image Restoration

问题引入

methods

实验

相关文章：

DiffIR: Efficient Diffusion Model for Image Restoration

xss一些笔记

以太坊网络中为什么要设置Gas上限

vue-cli是什么？和 webpack是什么关系？

leetcode刷题(46-50)

[渗透测试学习] Runner-HackTheBox

keil5显示内存和存储占用百分比进度条工具

示例:推荐一个应用Adorner做的消息对话框

Building wheels for collected packages: mmcv, mmcv-full 卡住

可视化表单拖拽生成器优势多助力流程化办公！

数据集制作——语义分割前png、jpg格式标签图转yolo格式.txt文件（附代码）

机器学习课程复习——ANN

C++回溯算法(2)

流量有限、日活低的APP适合对接广告变现吗？

Shell 学习笔记 - 变量的类型 + 变量的赋值

vue播放flv格式的直播流

Qt入门小项目 | 实现一个图片查看器

qt仿制qq登录界面

HashMap详解(含动画演示)

TVS的原理及选型

业务系统对接大模型的基础方案：架构设计与关键步骤

SkyWalking 10.2.0 SWCK 配置过程

论文解读：交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（二）

脑机新手指南（八）：OpenBCI_GUI：从环境搭建到数据可视化（下）

树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频

Cesium1.95中高性能加载1500个点

2025 后端自学UNIAPP【项目实战：旅游项目】6、我的收藏页面

鱼香ros docker配置镜像报错：https://registry-1.docker.io/v2/

Java 二维码

Java编程之桥接模式