自然语言处理(NLP)在放射学报告评价中的应用:应用和技术进展
自然语言处理(NLP)在放射学报告评价中的应用:应用和技术进展
- 写在最前面
- 摘要
- 引言
- 先进的技术
- BERT
- 算法
- 优点
- Applications in Radiology 放射学应用
- Quality 质量
- 将关键发现通知转诊临床医生
- 放射科关键绩效指标和评估 个别放射科医生的表现
- 同行学习和同行评审
- Clinical and Clinical Research Applications 在临床和临床研究中的应用
- Language Discovery 语言发现
- Other Applications 其他应用
- 总结
写在最前面
研究主体、研究方法、研究目的
摘要
自然语言处理(NLP)专注于计算机对人类语言的解释,可以用来评估放射学报告、展示有用的应用程序在医学成像交付
:
成像数据的解释
,提高图像采集、图像分析,提高成像服务的效率
。
本文在希望临床放射科医生理解的水平上回顾了NLP的一般技术方法,讨论了NLP技术的最新进展,并讨论了NLP在放射学中的当前和潜在应用。
引言
先进的数据分析,如人工智能(AI)和机器学习,已经在医学成像传输的基本所有方面展示了有用的应用:成像数据的解释、改善图像采集、图像分析和提高成像服务的效率。自然语言处理(NLP)是这些更广泛的数据分析技术的一个子集,专注于人类语言的计算机解释。1-5
NLP涉及到一系列的操作,将自由形式的文本转换为结构化的数值数据
,然后可以通过机器学习算法进行处理,以创建可用的信息。4 NLP已被发现在基于文本的放射学报告的分析中有许多用途。1-5
放射学报告
是一份文本文件,其中包含有关放射科医生对影像学研究中发现的所有影像学结果的解释的所有记录信息。3
放射学报告是主要和官方机制放射科医生和护理医生以及病人和他们的家庭和放射学报告是放射科医生的最终输出,它包含所有的相关信息生成的解释放射科医生。1-5
因此,放射学报告是许多潜在的有用应用的数据抽象的理想目标
。
NLP已经被用于生成放射学中的许多现实世界的应用程序——包括自动翻译系统、语音识别软件、报告搜索引擎、聊天机器人和数字助手。1
本文在临床放射科医生希望能理解的水平上回顾了NLP的一般技术方法,讨论了NLP技术的最新进展,并讨论了NLP在放射学中的当前和潜在的应用。
先进的技术
技术进步虽然由于放射学报告是放射科医生创造的信息的总和,因此具有丰富的信息,但从这些文件中提取信息存在许多挑战。
如上所述,NLP涉及一系列操作,将信息转换为可以分析的结构化数值数据。
由于许多放射学报告都包含自由的文本信息,因此提取出这些信息可能是一个挑战。虽然标准化报告的实施
有助于解决许多这些问题,但很多这些报告仍然是自由文本的,而有意义的数据提取仍然具有挑战性。
放射学报告的一些挑战包括歧义、语法、同义词、医学缩写、放射科医生之间风格和语言选择的变化
,以及特定放射科医生的语言选择随时间的不一致
。1-6
这些自由形式的放射学报告可分为两大类。
第一个是象征性的或基于规则
的。
基于规则的系统使用已定义的算法协议来模仿人类设计的规则。
优点:
理解
为什么一个特定的解释是正确的,因为角色是定义的,规则是可修改的,以及不需要提供训练数据来训练模型1。缺点:难以将此类应用
扩展到更复杂的问题
,系统无法适应细微差别,以及语言问题的挑战,如排版错误、同义词、代词的使用和听写方法的风格差异。1
大多数NLP放射学报告的最初尝试都使用了基于规则的方法。
另一种广义的自然语言处理方法被称为统计技术或机器学习技术
。1
机器学习技术不是依赖于一组已定义的规则,而是依赖于
对已由专家评估并进行注释的训练数据集的评估
。
然后,机器学习算法使用各种数学模型对这些数据进行训练,最显著的是神经网络。
优点:缺乏必要创建大量的语言规则,以及能够处理可能包含定义不明确的关系数据的复杂问题和大型数据集。1
缺点:需要在大型训练数据集上执行
高质量的注释
,缺乏对算法如何决定结果的理解
,以及由于系统使用的规则未知,无法从分析中的外部编辑单个规则或行为。这反过来又导致了解释能力的问题:依赖机器学习方法的系统充当“黑匣子”,对它们的运作方式几乎没有提供人类可以理解的见解,这使医学法律权利和监管要求的问题变得复杂。
虽然目前放射学报告的自然语言处理方法可以通过基于规则或机器学习方法来创建,但机器学习方法正变得越来越普遍,并在许多情况下被证明是有用的。1-5
表1提供了常用术语NLP的定义。
其他的在之前的文章有写,不详细展开
https://blog.csdn.net/wtyuong/article/details/130313812
BERT
在过去的几年中,NLP中最重要的发展之一是来自变压器的双向编码器表示(BERT)的发展。
BERT是一个开源的无监督框架,首次由谷歌AI于2018.8发布,它不同于以前的NLP方法,它提供了为特定单词生成不同的向量表示的能力,取决于其在句子或短语中的上下文。
BERT为单词提供了上下文的嵌入
,这取决于它在句子中的上下文。1-5,8
算法
BERT的训练过程不同于以前的算法,大约有15%的令牌被masked“掩盖”
。然后,该算法试图预测掩模标记的向量。1-5,8
Transformer“转换器”
是指BERT用来学习标记之间的上下文关系的神经网络架构。这允许对每个词的标记1进行逐步“更深层次”的向量表示,从而提高了NLP的性能。
masked“掩蔽”方法
,即随机选择的单词在原始文本中被掩蔽,系统学习从周围的上下文中预测它们,不需要标记数据进行训练。
大多数生成的模型都是在从网页中刮取的异常大的通用数据集上进行完全预训练
的。
通过transfer learning迁移学习
可以获得性能的额外改进,其中通用模型进行fine-tuned微调
以捕获特定领域的方言 和/或 语义。
优点
BERT可以间接地获取一般的语言知识,并可以在各种挑战中产生惊人的强大的结果。
作为自动编码器,转换器使用一个抽象的概念向量来捕获许多复杂的概念和关系。这给了伯特一种明显优于语言方法的推理能力。
例如,变形者可以简单地推断出语法极性(例如,确定语句是否包含否定,就像“结节被排除了”一样)。没有自定义训练过的分类器。1-5,9
Applications in Radiology 放射学应用
上述NLP技术在放射学报告中的应用已经证明了其在多个领域的应用,包括质量、临床护理、研究、语言发现、行政支持和教育。在本节中,我们将回顾在这些领域的一些示例。
Quality 质量
在质量改进和质量保证方面,NLP已经展示了多种潜在的应用。
将关键发现通知转诊临床医生
目前放射学质量界关注的领域之一是 遵守和执行有效沟通有关偶然结果的关键结果通知和后续建议。1-5,9
规定要求,放射科在影像研究中确定的关键发现通知转诊临床医生,并记录此类沟通。先前的研究表明,NLP程序可以被设计来定义关键发现沟通的比率
。10,11
其他研究表明,NLP程序对临床重要发现的检测的敏感性为98.9%,特异性为94.9%。
另一项使用BERT的研究表明,该项目在从放射学报告中识别可操作的项目时,受试者工作特征(AUROC)曲线下的面积为0.9516。
这些程序可能有助于
①提高关键发现沟通的可靠性,
②使监管目的的文件减少对人工审计的依赖。
这样的程序也可能会增加与重大的偶然发现有关的沟通的可靠性。类似的程序也可以应用于诸如放射科医生建议的额外成像等领域。1
放射科关键绩效指标和评估 个别放射科医生的表现
放射学报告的NLP评估也可能被证明有助于能够更有效地生成与放射科关键绩效指标和评估个别放射科医生的表现有关的数据。
通过这种方法,可以增强对用于放射学记分卡或仪表板14的任何关键性能指标的更有效的数据创建。
例如,放射科使用标准化报告已被证明与改善与转诊医生的沟通有关。15-20
监测这种合规性在历史上是通过使用人工审计来完成的,这可能非常耗时。
与人工审计相比,NLP程序能够计算放射科医生的合规率,以达到使用标准化报告的高准确性
。15
根据人工审计计算的使用标准化报告的平均依从性为91.2%,置信区间为89.3%至92.8%。在置信区间内,NLP自动审计计算的平均符合率为92.0%。
NLP自动化审计
的使用为跟踪该指标节省了大量的体力劳动。
同行学习和同行评审
NLP可用于监测报告附加物,以确定同伴学习目的的学习机会1。
最近的一篇文章展示了使用NLP来识别同伴学习案例,并在放射学-病理学相关会议上进行审查。21
另一篇论文使用机器学习算法来分析胸部CT研究中的图像,以识别肺结节。22
有潜在图像/报告差异的影像学研究被标记为随访对象,并在同行评审委员会中进行了审查。
这是传统同行评审的替代方法,在传统同行评审中,随机选择的研究的固定比例是双读的。
在30,000项CT研究中,有3.79%被标记为差异,并包括0.67%的真实漏诊。在200个真实的遗漏中,有118个被标记为具有临床意义。
Clinical and Clinical Research Applications 在临床和临床研究中的应用
从放射学报告中提取的NLP数据已经证明了多种应用来改善个别患者的护理,并通过临床试验和临床研究共同改善护理
改善临床护理的一个例子是使用来自放射学报告的NLP数据来量化肿瘤反应
。1-5
一项研究显示,来自CT研究的放射学报告的NLP处理数据在预测直肠癌患者的生存
方面优于其他临床生存预测因子,包括癌胚抗原定量。23
另一项研究表明,使用BERT可以结合来自腹部和骨盆CT扫描报告的信息来预测肝癌的存在
。
放射学报告的NLP处理也被用于标记癌症患者间隔变化的实例
25以及识别特定疾病
,如肺炎。26
另一项研究描述了一种Transformer模型,适用于包含偶然肺结节的研究的fine-grain classification细颗粒分类
,以计算潜在重新成像的召回率,或使用弗莱施纳协会的其他行动指南。
为了得出recall decision召回率,系统回答了一些关于报告内容的非常细微的问题:肺部是否有结节?有多少人?有大于6毫米吗?回答细致入微的问题和得出逻辑推断的能力远远超出了传统语言系统的能力,但通过BERT可以很好地处理,特别是当通用的预训练模型使用代表诊断成像叙述的语料库进行微调后(表2)。27
多项研究表明,可以从放射学报告中提取数据来进行临床研究。
使用NLP算法从头部ct的放射学报告中准确识别颅内肿块效应。28
其他研究表明,NLP可用于识别肺结节和基于人群的研究中的结节特征。29在另一个例子中,研究人员通过对大量癌症患者CT研究的放射学报告的评估,创造了转移性表型。放射学报告的NLP也可用于在临床试验中识别和聚合患者等任务。1-5
Language Discovery 语言发现
放射学报告的NLP也可以是一个有用的工具来理解和潜在地改进放射学报告本身的语言。之前的一项研究使用NLP来评估放射科医生报告的风格变化
。6
研究表明每个放射学报告的异常指标在放射科医生之间差异很大,最大值比最低值高10倍。与未使用标准化模板的放射学报告相比,这种差异显著更大,这表明使用标准化报告确实减少了自由文本
相关的风格变化。
该研究的一个方面评估了放射科医生之间冗长的差异
。冗长性被定义为在报告中存在1个或1个以上的句子,且该句子有超过30个单词。包含超过30个单词的句子的报告频率在不到1%到12%之间变化(图1),表明放射科医生的听写风格有很大差异。6
NLP在放射学报告语言学研究中的其他应用是基于对研究结果中的语言的评估,the automated generation of report impressions自动生成报告印象。
NLP还被用于将以临床医生为目标受众的技术放射学报告语言翻译为
使用患者和家属能够理解的非专业术语的语言
。这可以改善患者和家庭的体验。
Other Applications 其他应用
在放射学实践的许多其他方面,从放射学报告中的NLP评估中收集的数据可能被证明是有用的。这当然包括提高我们在放射学教育中的表现。检测能力通过NLP分析在放射学报告中进行的具体诊断可能有助于创建教学案例
,以及在放射学工作领域识别比较样本案例
,以便在临床工作期间进行及时教育。1-5
使用数字助理和聊天机器人
等工具,进行临床解释时对放射科医生的行政支持也被证明在提高效率和改善健康方面的潜在用途。例如,聊天机器人可以提供关于临床病史的快速答案,比如“病人怀孕了吗?”放射科医生不必搜索电子病历。它们也可以用于在护理点提供急性诊断成像结果,如通知急诊科医生,阑尾炎的超声结果是可用的。
总结
NLP的科学在过去的几年中取得了巨大的进步。NLP将成为放射学临床实践和工作流程的越来越综合的方面。本文回顾了最新的技术进展,为临床放射学家理解与NLP相关的命名提供了一个基本的框架,并提供了NLP在放射学中的位置和如何有用的例子。
相关文章:
自然语言处理(NLP)在放射学报告评价中的应用:应用和技术进展
自然语言处理(NLP)在放射学报告评价中的应用:应用和技术进展 写在最前面摘要引言先进的技术BERT算法优点 Applications in Radiology 放射学应用Quality 质量将关键发现通知转诊临床医生放射科关键绩效指标和评估 个别放射科医生的表现同行学…...
日常开发为什么需要做Code Review
日常开发为什么需要做Code Review 一、背景 最近在开始一个新的项目,在查看项目中代码及具体细节时,发现这个项目真实一堆乱麻,没有规律可循,可总结下这个项目的缺陷 没有规律可循,没有结构性设计不做公共封装&#…...
OSPF的优化
O_ASE --- 标志域外路由信息 --- 因为域外的路由信息不可控性较强,所以,信任程度较低,我们将其优先级设置为150。 LSA --- 链路状态通告 --- OSPF协议在不同网络环境下产生的用于携带和传递不同的信息。 LSDB --- 链路状态数据库 SPF --- 最短…...
C++项目中打破循环依赖的锁链:实用方法大全
C项目中打破循环依赖的锁链 一、简介(Introduction)1.1 循环依赖的定义(Definition of Circular Dependencies)1.2 循环依赖带来的问题(Problems Caused by Circular Dependencies)1.3 解决循环依赖的重要性…...
IDEA连接HBase
新建maven工程 打开pom.xml添加hbase需要的依赖 <dependency><groupId>org.apache.hbase</groupId><artifactId>hbase-client</artifactId><version>2.3.5</version> </dependency><dependency><groupId>org.apa…...
Mask2Former来了!用于通用图像分割的 Masked-attention Mask Transformer
原理https://blog.csdn.net/bikahuli/article/details/121991697 源码解析 论文地址:http://arxiv.org/abs/2112.01527 项目地址:https://bowenc0221.github.io/mask2former Mask2Former的整体架构由三个组件组成: 主干特征提取器ÿ…...
【量化课程】01_投资与量化投资
文章目录 1.1 什么是投资1.1.1 经济意义上的投资1.1.2 投资的分类1.1.3 金融投资1.1.4 个人投资者投资品种1.1.5 投资VS投机 1.2 股票投资的基本流程1.3 常见的股票投资分析流派1.3.1 投资者分析流派 1.4 什么是量化投资1.4.1 量化投资基本概念1.4.2 量化投资的优势1.4.3 量化投…...
SpringBoot实现导出Excel功能
1 问题背景 需求要做一个导出excel的功能 2 前言 本篇着重阐述后端怎么实现,前端实现的部分只会粗略阐述。该实现方案是经过生产环境考验的,不是那些拿来练手的小demo。本文阐述的方案可以借鉴用来做毕设或者加到自己玩的项目中去。再次声明,…...
NSSCTF之Misc篇刷题记录⑧
NSSCTF之Misc篇刷题记录 [MMACTF 2015]welcome[广东强网杯 2021 团队组]欢迎参加强网杯[虎符CTF 2022]Plain Text[SWPUCTF 2021 新生赛]原来你也玩原神[SWPUCTF 2021 新生赛]我flag呢?[鹤城杯 2021]New MISC NSSCTF平台:https://www.nssctf.cn/ PS&…...
从零开始学习Linux运维,成为IT领域翘楚(七)
文章目录 🔥Linux下常用软件安装_JDK和Tomcat安装🔥Linux下常用软件安装_MySQL安装🔥Linux下常用软件安装_MySQL卸载 🔥Linux下常用软件安装_JDK和Tomcat安装 Jdk 安装 解压jdk安装包 tar -zxvf jdk-8u201-linux-x64.tar.gz -C/…...
优漫动游设计APP的UI界面需要注意哪些问题?
一、加载 加载时间的长短,很大程度的决定了用户体验是否有所提升,虽然理想中的页面加载出来应该一秒就够了,但是设计师不要忽略网络问题!如果网速不够的话,页面加载三五秒都算是快的了,所以在用户等待的过程中&a…...
面试 004
什么是 Java 内存结构 Java 内存结构就是 JVM 的运行书数据区的内存结构: 里面有堆、虚拟机栈、本地方法栈、程序计数器; 虚拟机栈:里面的数据结构是栈帧,存放了方法名,局部变量等信息 方法区在 1.8 的时候…...
CCF-202206-2-寻宝!大冒险!
目录 题目背景 问题描述 一、思路: 二、实现方法(C) 2.1、方法一(int储存) 思路: C实现如下: 2.2、方法二(结构体储存) 思路: 注意:边界…...
二叉搜索树中的众数
1题目 给你一个含重复值的二叉搜索树(BST)的根节点 root ,找出并返回 BST 中的所有 众数(即,出现频率最高的元素)。 如果树中有不止一个众数,可以按 任意顺序 返回。 假定 BST 满足如下定义&…...
认识JSP
什么是JSP? JSP(Java Server Pages)是一种类似于HTML的标记语言,用于创建动态Web页面。与HTML不同的是,JSP页面中可以嵌入Java代码,由Web服务器在动态页面中生成HTML代码,从而实现Web应用程序的前端交互效…...
MySQL数据管理
一、MySQL数据库管理 1、库和表 行(记录):用来描述一个对象的信息 列(字段):用来描述对象的一个属性 2、常用的数据类型 int :整型 float :单精度浮点 4字节32位 double &…...
第十九章 Unity 其他 API
本节介绍一些其他经常使用的Unity类。首先,我们回顾一下Vector3向量类,它既可以表示方向,也可以表示大小。它在游戏中可以用来表示角色的位置,物体的移动/旋转,设置两个游戏对象之间的距离。在我们之前的课程中&#x…...
sha256算法详解,用C语言模拟sha256算法
SHA-256是一种加密算法,它可以将任意长度的数据块计算出一个固定长度的输出值,通常是256位。SHA-256具有以下特点: 1. 固定输出长度:SHA-256的输出长度为256位,不受输入数据的长度限制。 2. 不可逆性:SHA-256采用单向哈希函数,即无法从输出值反向推出输入数据。 3. 抗…...
前端技术未来发展展望
前端技术在未来的发展中将继续保持快速、变化多样和创新性强的趋势。以下是我认为前端技术未来发展的几个方向: 框架和库的演进:框架和库的更新换代将继续加速。React、Vue、Angular等主流框架的更新周期将会缩短,同时各自的生态系统也将更加…...
第四十六天|dp
今天的题还是完全背包的题 139. Word Break 这道题其实用deque也能做,但是需要cache去记录之前尝试过的值,.相对简单的办法就是用完全背包了 这道题worddict就是物品.我们的dp[i]代表到i为止是不是能满足题意分成segmentation 处置化全为false,但是dp[0]True.这是因为为0时…...
汇编语言-复习自用
本文用于自我复习汇编语言,参考b站一位老师的讲解整理而成,感谢老师的无私付出视频链接链接 文章目录 1.第一章1.1计算机组成1.2读取1.3 寄存器及数据存储1.4 mov和and指令1.5 确定物理地址1.6 内存分段表示法1.7debug使用1.8CS:IP1.9jmp指令改变csip1.1…...
Android moneky自动点击应用设想
近期又有人发错私密消息到群聊天里,造成巨大反应的事件,可谓是一失手成大恨,名利受损。 而如果手机里安装一个monkey自动点击程序,没事的时候,跑跑monkey,倒一杯茶,静静的看手机屏幕在那里点击&…...
16.基于主从博弈理论的共享储能与综合能源微网优化运行研究
说明书 MATLAB代码:基于主从博弈理论的共享储能与综合能源微网优化运行研究 关键词:主从博弈 共享储能 综合能源微网 优化调度 参考文档:《基于主从博弈理论的共享储能与综合能源微网优化运行研究》完全复现 仿真平台:MATLAB …...
使用 ESP32 设计智能手表第 2 部分 - 环境光和心率传感器
我们研究了如何为我们的智能手表项目制作一些有趣的表盘。在这一部分中,我们将研究如何将一些传感器连接到我们的智能手表,并将连接 BH1750 环境光传感器和 MAX30102 心率传感器。我们将分别研究这些模块中的每一个的接口。 先决条件——安装必要的库 本文下方提供的 GitHub …...
分布式事务 --- 理论基础、Seata架构、部署
一、分布式事务问题 1.1、本地事务 本地事务,也就是传统的单机事务。在传统数据库事务中,必须要满足四个原则: 1.2、分布式事务 分布式事务,就是指不是在单个服务或单个数据库架构下,产生的事务,例如&am…...
低代码开发重要工具:JVS列表页字段样式配置说明
列表页中,通常存在各种各样的样式控制,例如字段宽度需要可调、字段的颜色根据内容变化等,那么我们接下来介绍下字段的样式控制的内容以及对应的效果。 1、字段样式控制配置位置 进入列表页的 数据配置界面,每个字段可以有独立的配…...
explain结果字段分析
select_type simple:表示不需要union操作或者不包含子查询的简单select语句。有连接查询时,外层的查询为simple且只有一个。 primary:一个需要union操作或者含有子查询的select,位于最外层的单位查询的select_type即为primary且只…...
MySQL连接查询
MySQL连接查询 在多表联合查询时,为了减少查询的次数,使用连接查询可以一次查询多个相关联表的数据。 MySQL连接查询:分为内连接查询和外连接查询。 其中外连接查询又分成 left连接查询 和 right连接查询。 下午为两张数据库表,表…...
7. Docker——Dockerfile
本章讲解知识点 DockerfileDockerfile 常用命令Dockerfile 综合示例Docker Compose当我们理解了镜像的基本原理后,我们就可以开始 Dockerfile 的学习了。 1. Dockerfile Dockerfile 是用于构建 Docker 镜像的脚本。它包含一组指令,按顺序执行以创建 Docker 镜像,从而使其可…...
Input事件在应用中的传递(一)
Input事件在应用中的传递(一) hongxi.zhu 2023-4-25 前面我们已经梳理了input事件在native层的传递,这一篇我们接着探索input事件在应用中的传递与处理,我们将按键事件和触摸事件分开梳理,这一篇就只涉及按键事件。 一、事件的接收 从前面的…...
做网站工作怀孕/百度用户服务中心人工24小时电话
转自百度百科 数据库防火墙 系统,串联部署在数据库服务器之前,解决数据库应用侧和运维侧两方面的问题,是一款基于 数据库 协议分析与控制技术的数据库安全防护系统。DBFirewall基于主动防御机制,实现数据库的访问行为控制、危险…...
php网站建设文献综述/天津seo网站推广
转载自:点击打开链接 这是敏捷开发松结对编程系列的第十篇(栏目总目录)。 以下是本人自己及各企业所采用的代码审查的最佳实践,有些数据做了归纳,以使其“更佳”。 请特别注意每个实践最后简单总结的价值观。如果想采用…...
合肥做网站web0551/十堰seo优化
1.看看demo是怎样的在网上搜索“iOS支付宝sdk”,下载sdk(如图1)图1进入到图2点击左侧移动支付Demo&SDK再点击右侧的iOS&Android版资源,点击右侧SDK&DEMO下载SDK图2下载完成后解压,就得到了这个(…...
城乡建设部注册建筑师网站/最吸引人的营销广告词
Visual C#读取Excel表格中的数据: 一.程序设计及运行环境 (1).微软视窗2000 服务器版 (2)..Net Framework SDK Beta 2 (3&…...
福建住房与城乡建设部网站/seo需要什么技术
Python的特点如下: Python 是一种解释型,交互式,面向对象的高级编程语言。和别的一些使用标点符号的语言不同,Python使用了大量的英语单词作为关键字,因而具有很好的可读性。而且跟其他编程语言相比,它有更…...
树莓派做网站/互联网培训
本篇文章给大家带来的内容是关于MySQL如何通过实例化对象参数查询数据 ?(源代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。public static string QueryByEntity(T t) where T : new(){ string resultstr s…...