FSDiffReg:心脏图像的特征和分数扩散引导无监督形变图像配准
论文标题:
FSDiffReg: Feature-wise and Score-wise Diffusion-guided Unsupervised Deformable Image Registration for Cardiac Images
翻译:
FSDiffReg:心脏图像的特征和分数扩散引导无监督形变图像配准
摘要
无监督可变形图像配准是医学成像领域的一项具有挑战性的任务。在一系列基于深度学习的解决方案中,在保持变形拓扑的同时获得高质量的变形场仍然是一项艰巨的任务。
同时,扩散模型的潜在特征空间显示出潜在的变形语义建模。为了充分利用扩散模型指导配准任务的能力,我们提出了两个模块:
- 特征扩散引导模块(FDG)
- 分数扩散引导模块(SDG)
FDG使用扩散模型的多尺度语义特征来指导变形场的生成。
SDG使用扩散分数来指导优化过程,以在几乎没有任何额外计算的情况下保留变形拓扑。
FDG引入了一种直接特征扩散制导技术,利用交叉注意将扩散模型的中间特征集成到配准网络解码器的隐藏层中,从而产生变形场。此外,我们将特征引导嵌入到配准网络的多个层中,并在多个尺度上产生特征级变形场。最后,在获得多尺度形变场后,对其进行上采样和平均,生成全分辨率形变场进行配准
SDG通过基于扩散分数重新权衡基于相似性的无监督注册损失,为变形拓扑保存引入了明确的分数扩散指导。通过这种重称重方案,在优化过程中给予直接关注,以确保变形拓扑的保留。
Introduce
可变形图像配准是准确估计运动和固定图像对的相同解剖结构之间的非刚性体素对应关系(如变形场)的过程。快速、准确、逼真的图像配准算法对于提高临床实践的效率和准确性至关重要。通过观察病变等动态变化,医生可以更全面地为患者设计治疗方案。
传统的配准方法有:
VoxelMorph 以运动和固定的图像对作为输入,最大化图像对的相似度来训练配准网络。
为了获得更高的精度,大多数无监督方法采用具有多个子网络的级联网络或迭代优化策略。这些策略使得训练过程变得复杂,并且需要大量的计算资源。同时,为了获得更平滑、更真实的变形场,即拓扑保持,许多现有的工作引入了显式的微分同构约束或额外的循环一致性计算。
CycleMorph 在训练过程中利用双向配准一致性来保持拓扑结构
voxelmorphi-diff 采用了基于速度场的变形场和新的差胚估计
SYMNet 采用对称变形场估计来实现这一目标
论文的主要贡献
-
本文提出了一种新的基于特征的扩散引导模块(FDG),该模块利用扩散模型中的多尺度中间特征有效地指导配准网络生成变形场。
-
我们还提出了一个分数扩散引导模块(SDG),它利用扩散模型的分数函数在优化过程中指导变形拓扑保存,而不会产生任何额外的计算负担。
-
在心脏数据集上的实验结果验证了我们提出的方法的有效性。
Method
Baseline Registration Model
- 给定一个固定图像f、移动未对齐图像m和受扰动的噪声图像xt
- 我们将这个输入xin = {f, m, xt}输入配准网络的共享编码器Eβ,然后输入配准解码器Rθ。
- 配准解码器Rθ输出变形场φ,由我们的特征扩散引导模块Gσ引导
- 我们将m和ϕ馈送到空间变换层(STL)以生成扭曲的图像m(ϕ)。
- 通过对基于相似度的损失函数LscoreNCC进行优化,得到最终的配准模型。

a) FSDiffReg的工作流程。 b)特征扩散引导模块的过程说明。
特征扩散引导模块
- 主要组成是:辅助去噪扩散解码器Gσ
- 给定输入xin = {f, m, xt}, UNet共享编码器Eβ提取表示z
- z再被送入扩散解码器G和配准解码器R,得到中间特征映射对Fi = {(f i G, Fi R)}, i = 1,…,从解码器的第i层取N
- 值得注意的是,我们通过结合来自扩散解码器的制导来生成配准解码器的特征映射
分数扩散引导模块
- 给定由共享编码器z = Eβ(xin)编码的表示z,扩散解码器Gσ输出一个扩散分数估计S = Gσ(z)。然后,基于分数的扩散引导模块(SDG)使用该分数来重新权衡基于相似性的归一化互相关损失函数,
- 通过这种方式,SDG利用扩散分数明确地指出难以注册的区域,即变形拓扑难以保持的区域,然后在损失函数中分配更高的权重以获得更大的关注,反之亦然对于容易注册的区域。因此,SDG模块在没有额外约束的情况下,有效地将变形拓扑信息纳入优化过程
整体训练与推理
损失函数: 我们的网络在特征预测可变形域,然后输出配准的图像。我们的方法的总损失函数定义为


其中Ldiffusion为训练扩散解码器Gσ的辅助损失函数,t为xt的噪声级。我们提出的LscoreNCC鼓励在保持形变拓扑的同时最大限度地提高配准图像和参考图像之间的相似性。||∇φ ||2是变形场的常规平滑惩罚。λ和λ φ是超参数,我们在实验中经验地将它们设置为20。
Inference阶段: 我们将原始的参考图像f输入到网络中,而不是扰动后的图像xt,网络的总输入就变成了xin = {f, m, f}。
给定该网络输入xin,我们的网络首先在运动图像m和参考图像f之间产生变形场φ,并将运动图像m和变形场φ馈送到空间变换层(STL),产生配准的运动图像m(φ)。配准的运动图像是我们网络的最终输出。
实验和结果
数据集与预处理
我们使用公开可用的3D心脏MR数据集ACDC进行实验。该数据集包括100个具有相应分割图的4D时域心脏MRI数据。我们选择舒张末期的3D图像作为固定图像,选择收缩末期的图像作为运动图像。我们将所有扫描重新采样到1.5×1.5×3.15mm的体素间距,然后裁剪为128 × 128 × 32的体素大小。我们将所有图像的强度归一化为[−1,1]。训练集包含90对图像,其余10对图像组成测试集。
实施细节
框架由PyTorch库1.12.0实现的
使用DDPM-UNet的3D编码器作为我们的共享编码器
使用DDPM-UNet的3D解码器作为我们的扩散解码器
对于配准部分,我们只使用DDPM UNet的3D解码器作为配准解码器来生成变形场,而不是完整3D UNet。在扩散任务中,我们在2000个时间步长内逐渐将噪音时间表从10−6增加到10−2。我们使用Nvidia RTX3090 GPU和Adam优化算法来训练模型,其中λ=20,λξ=20,γ=1,批量大小B=1,学习率为2×10−4,最大时间为700个时期。
评估指标
我们采用了三种评估指标,即DICE、|J|≤0(%)和SD(|J|)来衡量图像配准性能,遵循现有的配准方法。DICE测量扭曲的运动图像和固定的参考图像之间的解剖分割图的空间重叠。Dice分数越高表示翘曲的运动图像和固定的参考图像之间的对准越好,从而反映了配准质量的提高|J|≤0(%)表示配准域的雅可比行列式中非正值的百分比。该度量表示缺乏一对一配准映射关系的体素的百分比,从而导致不切实际的变形和粗糙度。SD(|J|)是指配准域的雅可比行列式的标准偏差。较低的标准偏差表示配准场在整个图像上相对平滑和一致。
相关文章:
FSDiffReg:心脏图像的特征和分数扩散引导无监督形变图像配准
论文标题: FSDiffReg: Feature-wise and Score-wise Diffusion-guided Unsupervised Deformable Image Registration for Cardiac Images 翻译: FSDiffReg:心脏图像的特征和分数扩散引导无监督形变图像配准 摘要 无监督可变形图像配准是医学…...
音视频技术开发周刊 | 318
每周一期,纵览音视频技术领域的干货。 新闻投稿:contributelivevideostack.com。 日程揭晓!速览深圳站大会专题议程详解 LiveVideoStackCon 2023 音视频技术大会深圳站,保持着往届强大的讲师阵容以及高水准的演讲质量。两天的参会…...
asp.net docker-compose添加sql server
打开docker-compose.yml 添加 sqldata:image: mysql:8.1.0 打开docker-compose.override.yml 添加 sqldata:environment:- MYSQL_ROOT_PASSWORDPasswordports:- "8080:8080"volumes:- killsb-one-sqldata:/etc/mysql/conf.d 在docker里面就有了sql server容器镜像…...
uniapp 微信小程序 uni-file-picker上传图片报错 chooseAndUploadFile
这个问题真的很搞, 原因是微信开发者工具更新了,导致图片上传问题。 解决方法: 将微信开发者工具的基础库改为2.33.0一下即可。 在微信开发者工具详情 - 本地设置中(记得点击‘推送’按钮):...
《向量数据库指南》——用 Milvus Cloud和 NVIDIA Merlin 搭建高效推荐系统结论
如何搭建一个高效的推荐系统? 简单来说,现代推荐系统由训练/推理流水线(pipeline)组成,涉及数据获取、数据预处理、模型训练和调整检索、过滤、排名和评分相关的超参数等多个阶段。走遍这些流程之后,推荐系统能够给出高度个性化的推荐结果,从而提升产品的用户体验。 为…...
致:CSGO游戏搬砖人的一封信
最近大家还在坚持操作CSGO游戏搬砖项目不? 这个项目虽是稳赚项目,但也有行情好和行情不好的时候,平台的大中小各种活动的举办,都会对我们的项目造成一定影响。行情的上下波动势必然会影响卡价的波动,影响选品的快慢&a…...
MuLogin浏览器如何在一台设备上安全登录和管理多个LinkedIn账户?
一、LinkedIn多个账户的用处 LinkedIn作为世界上最大的专业人士社交平台,具有许多有用的功能,对于个人和企业来说都非常重要。以下是多个LinkedIn账户的一些典型用途: 1. 分行业账户:如果您在不同的行业从事职业活动,…...
STM32_project:led_beep
代码: 主要部分: #include "stm32f10x.h" // Device header #include "delay.h"// 给蜂鸣器IO口输出低电平,响,高,不向。 //int main (void) //{ // // 开启时钟 // RC…...
[go 反射] 入门
[go 反射] 入门 首先认识go 反射的两大概念,反射之路少不了他们 reflect.Type(接口)获取类型,和列名就找它reflect.Value(结构体)获取值,设置值找它 [tips] 通常是用这两者手底下的方法,reflect.Value结构体中有什么自行查看 …...
【计算机网络】数据链路层-MAC和ARP协议
文章目录 1. 认识以太网2. MAC协议MAC帧的格式MAC地址和IP地址的区别MTU 3. 局域网通信原理碰撞检测和避免 4. ARP协议ARP数据报的格式ARP缓存 1. 认识以太网 网络层解决的是跨网络点到点传输的问题,数据链路层解决的是同一网络中的通信。 数据链路层负责在同一局域…...
本周三商店更新:多款套装下线,四款升级武器带异色皮肤返厂
本周三将迎来26.2版本更新与11商店大更新,版本更新可点击26.2版本更新公告进行查看,这里不一一赘述了,下面大概罗列一下商店更新,有皮肤下架,大家还能趁最后时间入手,最重要的是四款升级武器返厂咯。 危险玩…...
WindowsServer2019-搭建FTP服务器
这里写自定义目录标题 一、基础配置IP地址安装FTP服务检查连通性Windows10连接FTP服务 二、了解和使用FTP具体模块及其配置1、FTP IP地址和域限制2、FTP SSL设置3、FTP当前会话4、FTP防火墙5、FTP目录浏览6、FTP请求筛选7、FTP日志8、FTP身份验证9、FTP授权规则10、FTP消息11、…...
国际阿里云服务器买哪种好用点?
在当时数字化年代,云核算已经成为了企业进行事务运营和数据存储的重要东西。而阿里云作为我国最大的云核算服务供给商,其服务器产品线也适当丰厚。那么,对于用户来说,阿里云服务器买哪种好用点呢?这需求依据个人和企业…...
2023NOIP A层联测25 总结
T1 让你构造 40 40 40\times40 4040 的只含 r,y,x 的矩阵,含有 r y x ryx ryx 的个数恰好为 n n n, n ≤ 2222 n\le2222 n≤2222。看完题后就开始想构造,一开始想构造 3 ∗ 3 3*3 3∗3, 5 ∗ 5 5*5 5∗5 的单位矩阵的,但是始…...
Thread类的基本操作(JAVA多线程)
线程是操作系统中的概念,操作系统内核实现了线程这样的机制,并提供了一些API供外部使用。 JAVA中 Thread类 将系统提供的API又近一步进行了抽象和封装,所以如果想要使用多线程就离不开 Thread 这个类。 线程的创建(Thread类) 在JAVA中 创建…...
Redis 的三种部署模式
提前叠个 buff:这个文章不涉及图(画起来比较麻烦),只是记录我的胡思乱想。 redis 从单点 -> 集群总共有三个部署模式:单机模式,主从模式,哨兵模式,集群模式 单机模式 新手入门模…...
【ArcGIS Pro二次开发】(73):使用NPOI库操作Excel
NPOI是一个开源的C#读写Excel、WORD等微软OLE2组件文档的项目。 NPOI可以在没有安装Office的情况下对Word或Excel文档进行读写操作。 相较于之前使用的Microsoft.Office.Interop.Excel,已经感觉到的优势,一是读写速度较快,虽然小数据量的读…...
python获取电脑所连接的wifi密码
电脑连接wifi后,很难直观地看到当前连接wifi的密码,需要借助命令行公管局才可以查看到相关信息。 CMD命令 查看所有已保存的wifi配置信息 netsh wlan show profiles查看某一个wifi的详细信息,需要输入wifi名称来查询 netsh wlan show pro…...
动态壁纸软件Live Wallpaper HD mac中文版功能特色
Live Wallpaper HD mac提供了一系列美丽的主题场景,将为您的桌面增添活力。从城市景观、日落到遥远的星系,每个屏幕都有特别的触感,可以定制您的天气小部件和时钟样式,并使用您喜爱的图片创建您自己的个性化壁纸。 Living Wallpap…...
Spring Boot 配置主从数据库实现读写分离
一、前言 现在的 Web 应用大都是读多写少。除了缓存以外还可以通过数据库 “主从复制” 架构,把读请求路由到从数据库节点上,实现读写分离,从而大大提高应用的吞吐量。 通常,我们在 Spring Boot 中只会用到一个数据源࿰…...
(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)
题目:3442. 奇偶频次间的最大差值 I 思路 :哈希,时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况,哈希表这里用数组即可实现。 C版本: class Solution { public:int maxDifference(string s) {int a[26]…...
【人工智能】神经网络的优化器optimizer(二):Adagrad自适应学习率优化器
一.自适应梯度算法Adagrad概述 Adagrad(Adaptive Gradient Algorithm)是一种自适应学习率的优化算法,由Duchi等人在2011年提出。其核心思想是针对不同参数自动调整学习率,适合处理稀疏数据和不同参数梯度差异较大的场景。Adagrad通…...
React Native 开发环境搭建(全平台详解)
React Native 开发环境搭建(全平台详解) 在开始使用 React Native 开发移动应用之前,正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南,涵盖 macOS 和 Windows 平台的配置步骤,如何在 Android 和 iOS…...
QMC5883L的驱动
简介 本篇文章的代码已经上传到了github上面,开源代码 作为一个电子罗盘模块,我们可以通过I2C从中获取偏航角yaw,相对于六轴陀螺仪的yaw,qmc5883l几乎不会零飘并且成本较低。 参考资料 QMC5883L磁场传感器驱动 QMC5883L磁力计…...
uni-app学习笔记二十二---使用vite.config.js全局导入常用依赖
在前面的练习中,每个页面需要使用ref,onShow等生命周期钩子函数时都需要像下面这样导入 import {onMounted, ref} from "vue" 如果不想每个页面都导入,需要使用node.js命令npm安装unplugin-auto-import npm install unplugin-au…...
Python爬虫实战:研究feedparser库相关技术
1. 引言 1.1 研究背景与意义 在当今信息爆炸的时代,互联网上存在着海量的信息资源。RSS(Really Simple Syndication)作为一种标准化的信息聚合技术,被广泛用于网站内容的发布和订阅。通过 RSS,用户可以方便地获取网站更新的内容,而无需频繁访问各个网站。 然而,互联网…...
【CSS position 属性】static、relative、fixed、absolute 、sticky详细介绍,多层嵌套定位示例
文章目录 ★ position 的五种类型及基本用法 ★ 一、position 属性概述 二、position 的五种类型详解(初学者版) 1. static(默认值) 2. relative(相对定位) 3. absolute(绝对定位) 4. fixed(固定定位) 5. sticky(粘性定位) 三、定位元素的层级关系(z-i…...
基础测试工具使用经验
背景 vtune,perf, nsight system等基础测试工具,都是用过的,但是没有记录,都逐渐忘了。所以写这篇博客总结记录一下,只要以后发现新的用法,就记得来编辑补充一下 perf 比较基础的用法: 先改这…...
土地利用/土地覆盖遥感解译与基于CLUE模型未来变化情景预测;从基础到高级,涵盖ArcGIS数据处理、ENVI遥感解译与CLUE模型情景模拟等
🔍 土地利用/土地覆盖数据是生态、环境和气象等诸多领域模型的关键输入参数。通过遥感影像解译技术,可以精准获取历史或当前任何一个区域的土地利用/土地覆盖情况。这些数据不仅能够用于评估区域生态环境的变化趋势,还能有效评价重大生态工程…...
css3笔记 (1) 自用
outline: none 用于移除元素获得焦点时默认的轮廓线 broder:0 用于移除边框 font-size:0 用于设置字体不显示 list-style: none 消除<li> 标签默认样式 margin: xx auto 版心居中 width:100% 通栏 vertical-align 作用于行内元素 / 表格单元格ÿ…...
