抽象的
在大数据筛选调查中,深入学习概念应直接应用于图像。在稀疏数据调查中,辐射图像特征估计播放了关键作用。http://bit.ly/2KnjlcZ
鉴于近期深度学习结果,问题出现了估计的射出量标志物是否可能很快是可分配的。因此,在这方面,我将喜欢比较两个计算的断层扫描(CT)肺部研究来讨论这个问题:深度学习(DL)癌症筛查分析,最近发表在自然医学,以及稀疏的数据射出标记结节病变调查,在这个问题上发表了欧洲呼吸杂志。在这方面,我想谈谈三个方面:什么时候放射性图像标记仍然有用?可用数据的数量对选择的统计方法有什么影响?统计分析在临床应用中应该如何独断专行?
他们基于CT图像的DL肺癌筛查研究于2019年5月发表rdilaet al。(1[报告称DL软件表现出放射科医生,误报的减少为误报的11%,否定为5%,当时没有来自同一患者的现有CT成像数据。作为一种软件开发策略,作者决定使用深卷积神经网络(DCNN)而不是射线图像特征(RIF)作为特征学习工具。他们基于开放计算机视觉竞赛最近发现的决定,表明DCNN方法优于使用手工工程特征[2,3.和Liaoet al。(4],谁赢得了2017年的Aggle 2017数据科学碗,用于使用DCNN来识别肺结核,并通过沃尔什et al。(5],谁使用DL用于纤维化肺分类任务。方法论上,Ardilaet al。(1]将42例579案例分为三个亚组:70%的培训,15%评估和15%的测试。从统计的角度来看,此过程毫无疑问,在这种情况下,选择的方法,因为可用数据的数量很大。
尽管DCNN方法在信息提取方面优于rif,有时也优于人类专家,但在只有几百张图像的稀疏数据时,DCNN方法无法成功应用aldes.等。(6]。虽然有可用的补救措施,如传输学习或数据增强,但随着较小数据集接受网络培训时,性能的劣化是显而易见的。在这种分类上下文中,因此,辐射图像标记保持不可缺少。此外,因为图像包含更多信息比当前定量标记可以提取,所以尝试改善RIF质量仍然合理[7]。
研究由r进行严等。(8]在这个问题上发表的研究欧洲呼吸杂志,遵循经典的放射学特征研究设计。其主要目的是开发一种用于结节病治疗和进展的放射组学生物标志物。通过CT图像(偏度、峰度、分形维数、Geary’s C、Moran’s I)和肺功能测试(1秒用力呼气量(FEV)评价RIF标记物1)、用力肺活量(FVC)、FEV比值1/ FVC)。对照组和结节病组回顾性收集两项不同的研究(对照组:COPD (COPDGene)的遗传流行病学,n=108,发表于2010年;结节病组:α -1抗胰蛋白酶缺乏和结节病的基因组研究(梯度),n=79,发表于2015年)。根据Scadding分期监测结节病的进展情况[9]在肺结节病[10- - - - - -12]。基于辐射瘤特征调查的分期提供了克服帧内和帧间间变异性的客观性和再现性的级别。事实上,这一发现是该研究的主要好处。作者还验证了他们的假设,即图像标志与临床调查结果相关。这是有意义的,因为这种相关性不一定存在,而且,到目前为止,相关性的证据是基于详细的口头描述[9,13]。总的来说,作者认为放射学特征调查可以对结节病患者的肺实质异常进行客观的数值表征。因为这项研究包括了相当少的患者,反映了肺结节病的低发病率,R严等。(8]没有将数据分成测试和重新测试组。在一项研究中,包括只有79例的患者,具有不同的助手阶段,假设可以产生两种类似的患者的患者群体仍然代表顺节病患者的正常变异性,这是不合理的。尽管从严格的统计观点来看,测试和重新测试设计将在稀疏数据环境下,研究设计可以被视为可接受的。
我认为这两项研究很好地说明了为什么应该注意不要虚假地比较不同的研究设计,这可能由于不同的可用数据量而可能需要不同的统计分析。虽然研究了rdilaet al。(1]和R.严等。(8]都是从图像中提取数字信息,两项研究的研究主题和调查数据量不同。因此,在大数据筛选分类任务中,直接从图像中训练dcnn似乎是明智的。另一方面,当研究数据稀少的孤儿病(如结节病)的放射性标记物时,RIF分析仍然发挥着关键作用,在我看来,肯定是不可或缺的。此外,在临床环境中,当研究数据稀疏的疾病时,重新测试设计也许不应该过于教条地治疗。
可共享的PDF
承认
我要感谢Barbara Ahlemeyer(Justus-Liebig大学,解剖学和细胞生物学研究所,Giessen,Germany)有用讨论。
脚注
利益冲突:奥伯特先生没有什么可透露的。
- 已收到2019年6月17日。
- 接受2019年8月3日。
- 版权所有©ers 2019