条文本

下载PDF

原文
铁的准确性没有诊断哮喘:一项系统回顾
免费的
  1. Stefan Karrasch1,2,3,
  2. 克劳斯·林德1,
  3. 歌塔洛克4,5,
  4. 哈丽雅特·萨默4,5,
  5. 土地肥沃的Karsch-Volk1,
  6. 乔斯Kleijnen6,7,
  7. 鲁道夫一Jorres3,
  8. 托尼斯施耐德1
  1. 1研究所的惯例,大学医院Klinikum雷希特der Isar,慕尼黑技术大学,慕尼黑、德国
  2. 2亥姆霍兹Munchen-German中心的流行病学研究所,环境健康研究中心,慕尼黑、德国
  3. 3研究所和门诊为职业,社会和环境医学、Ludwig-Maximilians-Universitat,慕尼黑、德国
  4. 4医学研究所生物统计学和统计、医疗Center-University弗莱堡,弗莱堡、德国
  5. 5医学院,弗莱堡大学,弗莱堡、德国
  6. 6Kleijnen系统评价有限公司,Escrick,纽约、英国
  7. 7学校公共卫生和基层医疗(CAPHRI),马斯特里赫特大学,马斯特里赫特、荷兰
  1. 对应到安东尼施耐德教授研究所的惯例,Klinikum雷希特der Isar,慕尼黑技术大学,Orleansstraße 47岁,81667年慕尼黑,德国;antonius.schneider在{}tum.de

文摘

背景测量铁没有可能替代支气管哮喘诊断的挑衅。我们旨在调查铁的诊断准确性没有测量而建立的参考标准。

方法系统评价和诊断分析。数据源是Medline、Embase,斯高帕斯2015年11月29日。敏感性和特异性估计使用二元模型。此外,总结接受者操作特征曲线估计。

结果26日研究4518名参与者(中位数113)被包括在内。偏见的风险被认为是低六七项5研究和五项7研究。荟萃分析的整体灵敏度为0.65 (95% CI 0.58 - 0.72),整个特异性0.82(0.76 - 0.86),诊断或9.23(6.55 - 13.01)和0.80曲线下的面积(0.77到0.85)。在多元回归分析中,更高的截止值与增加特异性有关(或每增加10磅的截止1.46)而没有与灵敏度。在不同铁敏感性的分布存在显著差异没有设备,但没有特异性。无论是发病率、年龄、使用bronchoprovocation > 90%的参与者或独家参考标准测试,也没有偏见的风险显著相关的诊断准确性。

结论似乎有一个公平的铁的准确性没有哮喘的诊断。整个特异性高于敏感性,这表明诊断潜在的统治高于排除哮喘的诊断。

  • 哮喘
  • 呼出气道标记

来自Altmetric.com的统计

请求的权限

如果你想重用任何或所有本文的请使用下面的链接,这将带你到版权税计算中心的RightsLink服务。你将能够获得快速的价格和即时允许重用内容在许多不同的方式。

关键信息

关键问题是什么?

  • 测量铁吗没有充分准确而建立的参考标准诊断或排除支气管哮喘?

底线是什么?

  • 整个特异性高于敏感性,这表明诊断潜在的统治高于排除哮喘的诊断;因此,菲没有测量可能使支气管挑衅部分多余的。

为什么要读吗?

  • 这个系统回顾和荟萃分析总结的方法、风险的偏见和发现的所有现有的诊断研究相关问题。

介绍

支气管哮喘是最常见的慢性疾病之一。它的特点是一个慢性炎症过程在呼吸道大多伴随的非特定的支气管hyper-reactivity以及可逆气流阻塞。1尤其在轻度哮喘气道阻塞通常是调查期间不存在肺量测定法,从而导致诊断的不确定性。2串行最大流量测量或支气管挑衅国际指南推荐这些情况。1然而,最大流量变化的低诊断价值已被证明。3,4因此,支气管挑衅确定支气管hyper-responsiveness仍然是不确定的参考标准,以防肺量测定的结果。5,6另一方面,支气管挑衅耗时,cost-intensive,通常只能在特定的肺功能实验室和也承担风险的严重的支气管痉挛。5

相比,铁测量没有呼出空气中浓度是一个非侵入性的方法,用于估计肺的炎症过程。哮喘患者,即使是在温和的疾病,已被证明铁呼气没有在较高的浓度,与高表达水平的相关性没有合酶诱导气道上皮细胞。7主要的病理生理基础是没有调节气道hyper-responsiveness8和与嗜酸性粒细胞的炎症反应有关。9因此,铁的浓度没有被认为是一种间接的标志气道炎症的程度。

相应的,铁没有讨论了测量作为替代过程诊断或排除支气管哮喘。这将促进哮喘诊断支气管挑衅,不推荐,因此,菲没有测量将是适合应用特别是在初级护理。卫生技术评估(HTA)发现的铁没有测量诊断途径可能增加诊断成本效益。10然而,铁的整体诊断准确性没有对哮喘尚不清楚。我们的系统回顾和荟萃分析的目的是估计菲的诊断准确性没有测量病人怀疑患有这种疾病。

方法

普洛斯彼罗的审查注册国际准注册的系统评价(CRD42014010810;完整的协议在网上提供补充材料)。理想的研究为我们回顾前瞻性研究招募连续,诊断,主要(> 90%)steroid-naive症状提示哮喘患者在自然环境(例如,由全科医生为病人诊断检测哮喘发作),不局限于非常具体的患者团体(例如,面包师),测试铁没有测量用明确的截止值根据现行准则对足够的参考标准。然而,这样的研究可能是罕见的,我们使用了更加自由的入选标准为我们的整体评估。合格,研究允许代2×2表供铁哮喘诊断没有相比之下,一个参考标准。参考标准可能是支气管挑衅,FEV的测量1bronchodilation,最大流量变化,专家的意见或这些方法的组合。研究参与者被疑似哮喘患者,至少75%必须类固醇天真。研究prediagnosed患者哮喘或人群中> 25%已经经历了审判的吸入型皮质类固醇激素被排除在外,我们预期太多先验诊断患者在这些研究(选择性偏差)。测量铁没有必须通过使用平均呼气流量50毫升/ s和瞬时流动45 - 55毫升/秒的范围内根据国际准则。11研究没有明确说明呼气流量包括如果使用仪器的技术性能保证结果只能获得流量在规定范围内。

一个系统的文献检索Medline数据库被处决,Embase,斯高帕斯(最后更新搜索2015年11月29日)。此外,确定论文的引用列表和系统评价是寻找合格的论文。搜索在Medline和Embase,奥维德(Wolters Kluwer)提供的接口应用。主要的医学研究从2014年9月30日网上所示补充表S1。搜索词对哮喘和哮喘指示结合指数测试。斯高帕斯,提供功能生成辅助文档的基础上,主要来源是另外应用列表。方法论的搜索过滤器更具体地识别诊断准确性研究都是不习惯的。12

重复数据删除后,两个评论者独立筛选搜索结果的标题和摘要,排除所有的研究显然不符合研究问题。剩下的引用是在全文检索和审查资格根据上述选择标准。包括以下相关信息提取研究由两个评论者独立使用预应力形式:设置,哮喘患病率、研究类型和招聘策略,研究中心的数量,类型,品牌和模型的分析,坚持测量指南;参与人数、年龄、症状提高哮喘的怀疑,包括吸烟者或近期呼吸道感染患者;截止水平;哮喘的患病率;和报告的发现。如果真阳性的数量,真正的负面,假阳性和真正的消极的受试者报告,这些值。只要有可能,我们使用数据截断点和最高的敏感性和特异性(即Youden指数);两项研究中,我们必须使用数据截止由作者指的是以前的研究,选择和三截止提交选择的原因是不清楚。 Otherwise, 2×2 tables were generated from the reported diagnostic accuracy parameter, that is, sensitivity and specificity, prevalence or predictive values. All studies included were assessed for quality using the Quadas-2 tool13(七项)。

基于提取的2×2表(= true积极,b =假阳性,c =假阴性,d = true -),灵敏度(/ (a + c)),特异性(d / (b + d))和诊断比值比(金龟子)(a / b / c / d)与相应的CIs 95%计算每个研究的报道截止。为进一步的统计分析,通过Reitsma二元随机模型14荟萃分析的诊断准确性研究应用使用正常不过的原始形式近似。15,16敏感性和特异性都集中使用的reitsma R的函数包“马达”(R核心团队。接待员:统计计算的语言和环境。R统计计算的基础,维也纳,奥地利。2015。http://www.R-project.org/;2016年3月29日)访问。此外,总结-操作者(sROC)曲线估计特征。为此,拉特和Gatsonis方法16洛克和舒马赫的方法17被应用。后者是基于假设研究人员的主要研究选择最优截止为每个研究基于最大Youden指数(敏感性+特异性−1)。结果截止优化的曲线调整。计算池DORs是基于根据DerSimonian-Laird随机影响模型方差估计。金龟子的异质性是衡量科克伦的Q和希金斯的我218研究小型研究发表偏倚的影响作为一个指标,根据Deeks漏斗图19是生成的。我们执行一个额外的最佳证据的分析局限于关键研究的理想研究会议上面列出的标准。在多元回归分析中,我们调查的影响哮喘患病率、类型(化学发光或电化学)和品牌(Niox米诺,Niox Flex或其他)的铁没有测量装置,截止值,年龄,是否> 90%的研究参与者接受支气管挑衅生化剂,是否积极支气管激发试验是唯一的意思是诊断哮喘和偏见的风险。变量的多元回归分析部分定性评估后选择可用的研究。

结果

文献检索发现共有6070引用其中287在全文检索(图1)。总共234个全文显然是无关紧要而进一步53进一步审查后被排除在外(见在线补充表S2)。同时,26日4518人参加的研究(中位数113,范围30 - 923)包括在审查(见研究的特点表1参与者在网上和额外的信息补充表S3)。20-45只给出结果的两项研究参与者分成子组(从不吸烟,烟民和当前吸烟者在一项研究中,根据具体的参考标准用于另一个);因此,26日研究提供29应急表进行数据分析。研究报告发表在2003年和2015年之间,来自16个不同国家。除了一个病例对照研究(嵌套在一个队列),所有群组研究。专门研究包括三个孩子,所有其他的研究主要包括成人或成年人(一项研究没有年龄的信息)。只有少数研究在病人组进行不同的症状,如咳嗽变异型哮喘或气喘儿童(见在线补充表S3)。在大多数研究中,参与者被称为专业研究中心执行,但是推荐的细节过程并不总是详细描述。使用的参考标准差异很大;支气管的挑衅和组合不同的程序经常被使用。哮喘患病率不同决定在9%和80%之间(平均39%;25和75 32%和51%)。全部或>在17个研究中,90%的参与者进行了支气管激发试验。在这些研究七,哮喘的诊断是完全基于这个测试时使用的所有其他研究测试或加强方法的结合。截止用于铁水平没有确定的诊断哮喘不同十亿分之10.5至64(平均30磅;第25和第75百分位20和40磅)。最常用的设备测量铁没有是Niox米诺(12项)和Niox Flex(5研究)。九个研究遇到的关键研究的标准;最常见的原因不包括其他的研究从这一组连续被怀疑研究自然和招聘严格避免排除相关的患者团体。

表1

包括研究的特点

图1

流程图。

研究质量变量,但没有被认为是低风险的偏见在所有七项评估(见在线补充表所有研究的详细评估S4)。这主要是由于截止电平的铁的事实没有测量定义事后在几乎所有的研究(这可能导致过高的诊断准确性)。许多研究也被认为不清楚有偏见的风险项V(可以参考标准,其行为或其解释引入偏见?)和七世(病人流可能引入偏见?)由于不足的报道。其他项目的问题是次要的。整体风险的偏见被认为是低六七项在五个研究中,五项七个研究和四项八个研究。剩下的六个研究偏差被认为是低风险的三个或更少的物品。

在个人的研究中,计算灵敏度变化在0.16和0.94之间,和特异性(见0.31和0.98之间图2A, B)混合灵敏度为0.65 (95% CI 0.58 - 0.72),汇集特异性是0.82(0.76 - 0.86)和混合的金龟子为9.23 (6.55 - 13.01)。金龟子的异质性是相当大的(Q = 112, df = 28 (p < 0.0001),我2= 75% (64%,83%))。据Rutter-Gatsonis曲线下的面积是0.80 (0.77 - 0.85)。结果的ROC散点图所示图3。所有包括单独研究策划以及汇集估计从二元模型包括相应的面积和95%的预测95%的信心,在未来的研究预计的95%。此外,根据拉特和Gatsonis sROC曲线以及洛克和舒马赫。包括研究的漏斗图(见在线补充图S1)不建议发表偏倚有关(p = 0.71)根据Deeks Egger测试修改19在九个关键研究,汇集灵敏度为0.68(0.53 - 0.79),特异性0.83(0.74 - 0.89),汇集金龟子10.21(4.78 - 21.82)和0.83曲线下的面积(0.75 - 0.92)(见在线补充图S2);异质性仍相当大(Q = 51岁,df = 8 (p < 0.0001),我2= 84% (72%,91%))。

图2

敏感性(A)和特异性(B)纳入研究的特征。

图3

池(Se)的敏感性和特异性(Sp)以及估计总结-操作者特性(sROC)基于计算根据拉特和Gatsonis曲线16(实线)和洛克和舒马赫17(虚线)。95%的置信区域(黑色实线)以及95%的预测区域(黑色虚线)。

在多元回归分析中,更高的截止值与增加特异性有关(或每增加10磅的截止1.46)而没有与灵敏度(见在线补充表S5)。无论是发病率、年龄、使用支气管挑衅> 90%的参与者或独家参考标准测试,也没有偏见的风险显著相关的诊断准确性。然而,在不同铁敏感性不同没有与Niox设备设备,显示低敏感性较其他化学发光装置(p < 0.01)。不同的铁的敏感性和特异性没有设备在表2。与流行多变量回归分析,选择的截止点和铁没有设备独立变量提供了类似的结果。

表2

多元回归的铁没有设备

讨论

在目前的系统回顾,我们发现一个公平的铁的诊断准确性没有一般对歧视的哮喘病人怀疑患有哮喘。我们收到了一个很好的总结曲线下面积。特异性大多高于敏感,和观察到的截止点主要是关于菲报道范围的指导方针没有解释。46

因为二元模型是基于对敏感性和特异性,不能直接否决,它不允许对医疗决策确定理想的截止点。然而,我们荟萃分析的结果允许更好地估计菲的诊断作用没有测量。观察值的特异性灵敏度通常优于。这表明,菲没有测量更适合统治比排除疾病。配件,如果摘要敏感性和特异性值发现在目前的荟萃分析应用于哮喘患病率超过中值(0.39),包括所有研究结果的阳性预测值(PPV)是0.70。PPV这样一个很类似的建立支气管挑衅测试程序。5,47平庸的特异性支气管挑衅可能结果因为传染病后支气管hyper-responsiveness, gastro-oesophageal返流性疾病,过敏性鼻炎和更多,从而导致假阳性诊断。5因此可以认为铁没有测量可能使支气管挑衅部分多余的。在这种背景下,对指导治疗类固醇响应的预测可能比仅仅使哮喘的诊断更相关。它已经表明,铁没有测量有预后价值评估类固醇的响应能力。40,48配件,美国胸科学会(ATS)指导方针建议菲没有值> 50磅可以用来指示的嗜酸性粒细胞的炎症反应,在有症状的病人,响应性糖皮质激素是可能的。46最初,我们也要评估是否菲没有在特定的子组的病人的附加价值,例如,慢性咳嗽气喘。然而,我们发现不允许只有少数研究池的数据进行进一步的亚组分析。

报告的铁没有截止值通常是在区间的低端ATS准则定义为“中间”46成人(25 - 50磅)或儿童(20 - 35磅)。甚至在考虑铁的一般对数正态分布没有值,这中间的低阈值范围可能过高的可靠排除哮喘。这种观点是支持研究结果表明低截止值介于9和16磅的排除哮喘。37,49这对于排除哮喘较低的性能可能解释为铁的弱点没有关于non-eosinophilic炎症。37,50然而,最近的研究表明,铁没有更具代表性的Th2-driven炎症,特别是支气管粘膜,而不是一般的嗜酸性粒细胞的炎症反应。51-53这也许可以解释为什么排除哮喘仍然可能是可能的,但只有在低铁没有值,这可能是9到16磅左右。然而,困难排除non-eosinophilic哮喘时应该牢记的哮喘症状和临床历史表明了(但菲没有很低。非常低的铁没有值可能表示缺乏气道炎症过程的情况下,负面预测值的80%左右,提供了这个适合病人的病史。54

在临床实践中因此,诊断途径可以先菲没有测量。支气管挑衅时将多余的铁没有超过一个截然不同的截止值,需要提供一个有意义的PPV。当铁转诊支气管挑衅将是必要的没有值低。积极的回应在支气管挑衅将有助于诊断规则的哮喘患者的低铁没有值,消极的反应会排除哮喘支气管挑衅。5,47根据先前的研究,铁程度尚不清楚没有测量比支气管挑衅更有前途的指导与吸入糖皮质激素治疗。最近的一项研究表明,患者也有一些负面的支气管挑衅反应可能受益于吸入皮质激素类固醇(ICS)当菲没有因为菲> 33磅的没有测量结果是有用的预言ICS比诊断哮喘反应。55然而,可能会有一些过高的预测价值的作者选择反应条件的国家可能是“过于敏感”。因此,进一步的研究比较支气管挑衅和铁的诊断作用没有测量和评估的信息价值组合,最理想的长期研究。

回归分析表明,诊断精度的敏感性不同在不同的铁没有设备。它可能猜测如果Niox仪器的低敏感性与其它化学发光设备相比可辩解的由不同的临床诊断的研究。然而,我们没有发现患病率的关系,截止点和铁没有设备在多变量回归分析,这可能是,另一方面,可辩解的低数量的研究。然而,这种相关性,而低,特异性更高的重要性。完全不同的设备显示相对高特异性,这增加了多元回归分析随着截止点。这再一次表明,铁没有测量更适合在排除疾病。

我们的系统回顾和荟萃分析提供了一个全面的总结现有研究调查铁的诊断准确性没有患者的症状提示哮喘。它是基于一个协议后执行预定义方法和Cochrane诊断测试精度工作小组的建议。56我们的研究选择在某种程度上不同于两个相似的最近的评论。10,57仔细系统回顾的一部分执行诊断评估报告委托由国家卫生研究所(NIHR)在HTA项目代表国家健康和保健研究所(NICE) Harnan10包括24个研究,我们排除了6,主要是因为高度选择的患者群体(例如,只有患者负metacholine挑战),调查预测类固醇响应,而不是诊断哮喘,和足够的数据报告分析(见在线补充表S1)。七个八个额外的研究包括美国都是最近才发表或不确定;一项研究32被排除在外。应该注意,HTA报告更少的关注评估诊断准确性本身但专注于过程兼容常规临床路径在英国。该报告的作者决定不进行荟萃分析,因为强大的临床异质性的研究。虽然我们认为我们荟萃分析的联合估计必须解释相当谨慎由于临床和统计学异质性,我们考虑荟萃分析可取的和合理的有几个原因。首先,一些异质性的研究包括Harnan是由于他们在某些方面更广泛的入选标准。第二,叙事评论让读者没有一个直观的了解整个研究结果可用。第三,我们的方法允许我们调查潜在原因通过多元回归经验研究结果之间的异质性。第四,使用单独密钥非常严格的方法研究显示类似的结果作为主要分析。然而,异质性居高不下也在研究制定的关键。

李最近的系统评价57实际上还包括荟萃分析和多元回归分析。然而,本文可能有重要的缺点。总共6 19的研究分析了被我们排除由于高度选择的数量,不寻常的铁的技术没有测量或者因为我们无法构建一个合理的和一致的列联表的数据。不少于12所包括的研究我们没有提到的。虽然在2015年发表的一项研究可能没有作者,可用这种巨大差异的原因尚不清楚的选择过程是不透明的。综述汇集敏感性高于在我们回顾(0.78 vs 0.65),特异性略低(0.74 vs 0.82)和金龟子略高(11.37和9.23)。

之间的重要联系截止点和特异性的提高多元回归分析是合理的,符合临床决策规则,它允许在哮喘与更高的确定性高铁没有值。46,54我们不确定是否根据菲的类型和品牌的差异没有测量装置是有效的或一个机会发现。另一方面,考虑到有限数量的研究和潜在影响的多重性变量,根据其他因素存在差异可能已经错过了。此外,感染、吸烟习惯等因素可能修改的结果FE和过敏没有测试58很难调查没有个体患者数据。

还应该考虑,包括研究的主要目的是定义最优截止水平基于观察的特定的患者群体。这可能导致过高的诊断准确性/研究结果的荟萃分析。我们使用替代方法根据洛克和舒马赫17计算sROC曲线意味着修正这个问题。得到的值是在信心的经典拉特和Gatsonis calculatory方法。16

总之,系统回顾和荟萃分析显示有前途的铁的测试指标没有测量具有良好的特异性,DORs和ROC曲线下面积。高特异性表明哮喘诊断潜在的裁决,尽管敏感性和疾病的患病率也很重要。然而,灵敏度相对较低,这表明排除可能与铁相当困难没有测量。尽管不可能提供明确的分割点最佳的敏感性和特异性,我们的结果指向确认诊断研究的必要性。与诊断研究这方面的诊断测试完全配对研究设计定义了一个先天的截止值需要评估潜在的部分替代支气管挑衅。59它应该记住高截止值似乎更适合在哮喘。这意味着理想的先验分界点不应仅仅决定的基础上最高的敏感性和特异性,而是最佳PPV的考虑,这可能与更高的特异性,但灵敏度较低。研究表明PPV > 70%,截止> 45磅的选择。2美国胸科协会指导46表明菲没有> 50磅的检测电路响应指的是史密斯的研究40因此,切割点大约50磅可能保证足够的PPV裁决在哮喘和确定ICS同时响应,与亚组分析记住可能较低的值。未来的诊断准确性研究应充分优化报告其ROC曲线数值允许使用更深入的荟萃分析。

引用

视图抽象

脚注

  • 贡献者研究构思和写评审协议。GR、JK RAJ, SK和KL导致了协议的发展。SK, MK-V和KL进行文献搜索、选择、数据提取质量评估和数据输入。HS和GR计划和执行统计分析。,KL和SK起草了手稿。所有作者导致数据解释和关键的修订草案的手稿。担保人。

  • 资金支持的项目是德国联邦教育和研究(BMBF FKZ 01 kg1211)。

  • 相互竞争的利益SK宣称他使用NIOX州立测试装置由Aerocrine提供免费学习以外的提交工作。

  • 出处和同行评议不是委托;外部同行评议。

  • 数据共享声明的完整数据集执行的分析可作为在线MS Excel文件补充材料

相关的文章

  • 电视广播
    “三巨头”