文摘
计算机辅助阅读的关键差距限制证据基础CXR结核病。我们描述了一个研究议程http://ow.ly/JkmQ30cynWR
介绍
188bet体育备用网址当前问题的肺结核检测和计算机辅助评价胸片解释的潜力
在2015年,估计有1040万个新的结核病(TB)情况下,但是只有610万个(59%)被发现,通知国家结核病规划(国家结核控制规划)1]。世界卫生组织(世卫组织)强调,需要更加积极主动努力去关闭这个走向消灭结核病病例发现差距(2,3]。进展近几十年来在改善实验室服务。新的结核病诊断测试可用,正在扩大其使用(4]。一直在努力提高人寻求治疗的评价,符合结核病症状。然而,许多结核病患者仍未确诊的或只经过长时间延误诊断和治疗1]。
大部分的活动性结核病没有古典结核病症状,而结核病可以检测到异常的帮助下在发病的早期胸部x线摄影(CXR) [5]。然而,获得高质量摄影专家的解释是有限的在许多设置,和硬件成本高以及基础设施需求使它具有挑战性的分散技术(6]。出于这个原因,以及担忧由于低CXR-based结核病诊断的特异性和高内部inter-reader可变性,以前的世卫组织的建议强调CXR资源有限的设置主要用于当肺结核细菌并不能被证实,因此最后的诊断算法。
然而最近,CXR已经提升为一个有用的工具,可以放置在系统筛查早期(即。因为病人不积极寻求医疗保健有结核病的风险),在筛选算法(即。在病人护理症状)来识别那些需要确认实验室测试(图1)[7]。重新评估CXR的作用的一个重要原因是数字放射显影术可用性的增加,带来了许多超过传统摄影的优势,如降低运行成本,更好的图像质量,更好的安全(8]。
摄影访问已有所改善,但人力资源阅读射线照片仍然是有限的,尤其是在农村地区在资源有限的国家9]。计算机辅助诊断(CAD)是一个潜在的解决方案,这是使用计算机程序分析CXR TB-compatible异常的存在。CAD可以援助或取代放射科医生和其他健康保健人员阅读影像学电影,从而帮助实现的潜力迅速扩大结核病系统数字放射学检查,和筛选7]。
目前的景观摄影及计算机辅助检测
迄今为止,唯一的商用CAD课程评价结核病CXR CAD 4 TB,代尔夫特拥有的专有软件成像系统(Veenendaal,荷兰)。图像判读与cad 4 tb是基于机器学习的方法。项目分析摄影图像特征,使用分布由一组训练图像,产生异常分数从0到100(更高的分数表明结核病的可能性更大)(图2)。
临床决策需要分类的解释影像学异常;因此,operationalise连续异常分数在临床上有意义的方式,需要选择“阈值分数”:结核病是排除如果x光照片的异常分数低于这个阈值,而结核病仍然是可能的,如果分数等于或大于这个阈值。目前,开发者不推荐一个阈值的分数,而不是建议用户选择他们自己的基于可用的数据用途。这种方法的挑战和潜在的局限性在下面讨论。
其他CAD发展解决方案包括CADx (Advenio、印度)。CADx,类似于cad 4 tb,硬件是中立的。另一组最近评估软件项目,使用深度学习算法,GoogleNet AlexNet,有前景的结果在一个病例对照设计诊断研究[10]。所有的解决方案,在其目前的形式来看,开发评估结核的可能性但没有明确提供其他肺部发现和条件的信息。
证据目前计算机辅助检测的解决方案
通知谁指导CXR结核病检测我们最近进行了两次系统评价的证据基础,2016年7月解决cad 4结核病的诊断准确性微生物确诊肺结核,第二也包括未发表的研究(7,11]。没有发表的研究可从Advenio CADx日期。我们确定了9个研究提供数据诊断准确性相比,微生物参考标准的文化或核酸扩增试验(NAAT)。CXR被用来评估人寻求与假定的结核病症状护理,即。诊断用例,在六个研究,系统筛选不管症状(如。在积极发现病例或患病率调查)在三个研究。从今以后,我们将使用术语分类与系统筛选分离这两个主要的用例。
审查表明cad 4 tb软件能够实现高灵敏度,但特异性较低的成本分类用例,即。> 85%的敏感性与特异性,从23%到69%不等;,有太少的检查用例研究自信地估计在这种情况下,诊断的准确性。重要的是,审查确定了数量的限制可能会导致偏见的评估诊断准确性,和有限的generalisability发现(表1)。一个首要关注的是几个版本的cad 4 tb存在,最新版本的证据基础,特别是,只有少量的研究。另一个广泛的问题是,大多数研究没有cad 4 tb的性能评估operationalised时它将最有可能被使用。例如,在三分之二的系统筛查研究,回顾性评价cad 4 tb的准确性只有一个子集的人症状或人类读者确定射线照片异常;因此,这些研究并不适用于软件的情况下将申请系统的筛选。
证据基础的强度是大多数分类研究文化或NAAT用作诊断肺结核的参考标准。在一个分类研究中,一个复合微生物测试和临床随访数据作为参考标准排除结核,这是确定为潜在的偏见的一个重要来源,因为它导致一大部分的人被排除在分析诊断的准确性,因为他们没有给后续[12]。在系统的筛选研究中,微生物测试用于诊断结核病在所有的人症状或人类读者识别影像学异常,但无症状的射线照片的人解读为“正常”被认为没有结核病没有进行微生物测试。我们不认为这是偏见的重要来源的假阴性的可能性分类测试子集被认为是很低的环境中筛选。
有实质性的变化阈值的成绩是如何被选中。在大多数系统的筛选和分类研究,调查人员也报告了诊断准确性一系列阈值评分,或回顾性选择得分匹配性能的人类读者。其他的研究选择使用的训练集CXRs定义阈值较大的验证集。研究使用,这种方法是有效的,但是,对于一个诊断测试,需要预先确定的阈值。每个cad 4 tb的用户的要求确定一个适当的阈值使用训练集的局部射线照片之前使用的软件将很难operationalise同时避免潜在的偏见起源于射线照片的选择对于训练集,选择和使用参考标准,和足够的力量,以确保精度估计的诊断准确性的措施。
预先确定的阈值的分数为不同的用例需要决定套CXRs充分代表患者群体,胸部病理学和鉴别诊断发现,没有被用于培训的软件。目前发表的和未发表的证据不符合这些标准由高结核病患病率(如图所示即。15 - 60%在系统分类研究和筛选研究2 - 4%),和艾滋病毒(如。在四个六个分类研究33 - 68%),因此结果不能全面穿过人群。最后,小数据是否病人特征修改软件的准确性,最值得注意的是,年龄,性别,艾滋病毒状况,先前的历史活动性结核病,并发症和涂片状态。
基于有限数量的研究,和上述方法论的问题,世卫组织还没有开始一个过程开发CAD结核病检测指导方针。2016文档总结当前建议CXR CAD用于研究建议理想的协议后,导致所需的证据基础指南开发(7]。
理想的计算机辅助检测的解决方案
理想的CAD的特点解决方案已确定与该领域的专家的意见。理想的CAD解决方案应该不仅表明他可能结核病,也确定其他异常,需要进一步的临床检查(如。心脏肥大、肺结节,间隙模式)。“不正常的分类——可能结核病”与“异常——可能结核”与“正常”至少应该是可能的。这将解决伦理问题的使用cad 4 TB代替人类的读者,在有症状的病人,并确定没有结核病在cad 4结核病系统筛查,但对病态出现在射线照相法需要进一步评估。此外,应该预先定义的阈值的CAD优化性能的两个用例。
CAD的解决方案应该是易于使用,最好是由最低限度训练有素的医疗工作者(不到1天的培训)。性能特征的检测肺结核(TB)在成人和儿童应该类似于目前报道与人类读者在两个用例(13]。
CAD的解决方案应该能够解释不同CXR图像设备,精度和不同人群没有变化。软件应该能够识别与CXR质量问题,并表示他们的用户或开发人员至少应该提供一个评估的x光照片质量,和适合使用CAD为临床护理解决方案之前使用。CAD的解决方案应该能够传输图像的远程医疗会诊专家如果需要,并通过安全这样做意味着保护病人的隐私。
吞吐量应该每分钟至少一个x光照片,和最佳速度。解释应小于1美元/图像,从而达到每月的成本约480美元如果软件是利用评价,平均每天20名患者,每周6天。
研究问题需要解决的政策指导
几个关键问题需要解决CAD用作临床援助。
为了CAD课程产生连续的异常分数,如CAD 4 tb,用作诊断测试,而不是仅供研究,需要预先定义的阈值。阈值可能不同在用例预期的环境中系统的筛选,CXRs最小病理学,而在诊断测试的背景下,肺更实质性的发现将礼物。阈值可以指定在套CXRs充分代表的人口不同的用例。CXRs需要包含关键人群的集的特点是艾滋病毒状况,年龄,性别,结核病之前,疾病(如。阻塞性肺疾病、矽肺)和涂片状态为了保证generalisability数据在这些组。
CAD的性能对人类读者对于实现决策很重要,即使它是具有挑战性的测量由于人类读者可变性的特征。理想情况下,比较完成对训练有素的放射科医生;然而,实现决策需要考虑可用性的放射科医生是有限的,并且经常训练提供者最终读CXR更是少之又少。根据用例,读者也可以期待不同的性能之一(在该领域系统的筛选与在医院诊断用例)。比较人类读者因此应该指定培训水平的读者,和理想的包括,和更少的训练有素的读者。与预定义的阈值,CAD能够模拟一个二进制或分类的解释结果,类似于人类的读者使用在临床设置。
作为一个软件解决方案,需要将版本更新更频繁的情况在体外比较性能诊断,快速审查需要可行的一个新版本的适用性提出建议。监管机构如美国食品和药物管理局关于这个主题提供了指导,并允许以一个预定义的性能报告CXR图片银行与制造商(住14]。为了允许可比性的数据在不同的CAD的解决方案,和不同版本的一个解决方案,一个预定义的CXR图片银行,允许评估在关键人群会更好的被一个独立、中立的组织(如世卫组织或世卫组织合作中心)。
至关重要的实施CAD是承认CXRs用于non-TB肺部疾病。因此,结核病的临床影响解决方案需要考虑。的系统筛查用例,CXR识别结核病早期可以帮助预防传播之前,表示关心。可以认为失踪的其他疾病在这种情况下是不像病人有害没有就医。然而,一个解决方案,不接,例如,骨量或肺癌结节,为早期干预可能会错过一个机会,给一个病人错误的保证。为患者寻求治疗,因为症状(即。分流的用例)的限制只有识别结核病与non-TB可能更重。是派拉蒙CAD解决方案引发进一步检查通过识别异常即使它不太可能是结核病。在缺乏的能力叫“异常——不太可能结核病”,所有CXRs必须由放射科医生除了CAD读取。这可能影响成本效益。同样,因为一些CXRs兼容肺结核病变,可能事实上是由于癌症或感染结核病(如。蛀牙,结节,胸膜腔积液),需要指导临床医生对患者应该做什么标记通过cad 4 TB的CXR是“异常——可能结核病”,但微生物测试不确定肺结核。因此,安全,和伦理问题需要考虑如果发行建议使用TB-centric CAD人类读者如果不验证了结果。
的实现和经济问题也需要考虑,以确保可接受性,以及公平和可持续的用法:其中包括成本的软件,更新和不同的支付模式。
策略1:评估在一个标准的面板中
在标准样品板的情况下,可用于测试验证,我们建议组装一个银行的数字CXR文件1)代表光谱的结核病病理(15];2)代表病理鉴别诊断(16];3)代表分布的患者根据性别、艾滋病毒状况,年龄,和地理起源;4)代表两个不同的用例的患者团体分类和系统的检查。这个“标准委员会”将有独立的CAD制造商/开发人员或一个世卫组织合作中心。它将评估可用的CAD解决方案的目的,和未来版本相同的软件,以及允许比较新颖的CAD项目的评估。这个评估标准面板将免费分析现有的数据发表在系统回顾(理想情况下个体患者数据分析利用CAD软件的最新版本)。
这个标准的数字CXR文件面板可能来自:1)完成或正在进行的研究,利用数字CXR分流或系统筛查用例,并执行所需的参考标准如下定义(但不利用现有CAD软件,以避免开发人员访问软件培训的文件),2)结核患病率调查或3)成像银行现有的数字CXR文件与适当的病理学的结核病,以及鉴别诊断(如。国际移民组织的数据库)。
策略2:评估在适当设计和代表性的前瞻性研究
第二种策略将包括识别计划或正在进行的试验集成CAD的评价,或进行新的研究。下面的设计考虑应该遵循这些建议。第二种策略可以通过分析评价标准的面板。
一个专家小组由世卫组织目前正在委托过程中评估可行性,这些策略和时间表。虽然第一个策略是想象可能在短短几个月内,第二需要至少1.5年(图3)。
建议设计元素研究评价计算机辅助检测
未来所有的CAD的研究解决方案,调查人员应该考虑我们列举的某些设计特点表2,这将有助于确保生成的数据实施最有益的目的。我们专注于功能,减少潜在的偏见,并增加generalisability循证。报告应遵循指南报告诊断准确性的研究(17]。表2仅限于研究的诊断准确性;然而,额外的研究和建模需要通知指导最好的扩大。实现研究和传播模型应该告知最好的策略,以确保最大的影响,例如,在上下文中的系统筛查高危人群或在医院感染控制设置通过高危患者的早期诊断。此外,研究应评估的成本效益CAD在隔离还在实现策略18,19]。在理想的情况下,实现研究将对替代方案比较CAD (如。tele-radiology),在不同的上下文中对现状(20.]。
结论
CAD的解决方案可能提供了一个机会来扩大使用CXR改善案例发现,感染控制和降低成本的情况下检测在诊断算法。需要进一步的证据来指导使用CAD在临床护理评估其性能,确保其符合道德标准,并确保最高的影响。
披露的信息
确认
作者的贡献:f·艾哈迈德汗,t·潘德和b . Tessema回顾了文献;数据编制的f·艾哈迈德汗蔡玫Denkinger和m .派;f·艾哈迈德汗,t·潘德b . Tessema r·歌的趣事,m . Pai k Lonnroth和蔡玫Denkinger进行了数据收集、分析和解释。他们还写道,回顾了文章。
脚注
支持声明:这项工作是由荷兰政府通过资助找到(PDP15CH14)和美国国际开发署资助的人。投资者没有参与研究设计、数据收集和分析,决定发表,或准备的手稿。r .歌曲得到了尤尼斯•肯尼迪•施莱佛国立儿童健康和人类发展研究所的美国国立卫生研究院(K23HD072802)。f·艾哈迈德汗收到薪水昏聩de矫揉造作的魁北克健康的支持。
利益冲突:披露可以找到与这篇文章www.qdcxjkg.com
k . Lonnroth是世卫组织的工作人员。作者独自一人负责发布和他们所表达的见解不一定代表世卫组织的决策或政策。
- 收到了2017年5月9日。
- 接受2017年5月12日。
- 这个工作的内容是作者的版权或他们的雇主。设计和品牌版权©2017人队