用于医疗保健专业人员

CC通过数控188滚球软件
研究方法和报告

多个归责缺失数据的流行病学和临床研究:潜力和陷阱

BMJ2009年;338年doi:https://doi.org/10.1136/bmj.b2393(2009年6月29日出版)引用这个:BMJ2009;338:b2393
  1. Jonathan C Sterne统计学和流行病学教授1,
  2. 伊恩·R白资深科学家2,
  3. 约翰B卡林临床流行病学和生物统计学主任单位3,
  4. 迈克尔斯普拉特,研究助理1,
  5. 帕特里克·罗伊斯顿资深科学家4,
  6. Michael G Kenward生物统计学教授5,
  7. 安吉拉·米木生物统计学,讲师6,
  8. 詹姆斯·R木匠,读者在医学和社会统计数据5
  1. 1社会医学、布里斯托大学、布里斯托尔BS8 2公关
  2. 2MRC生物统计学单位、公共卫生学院、剑桥CB2 0 sr
  3. 3临床流行病学和生物统计学,默多克儿童研究所,和墨尔本大学,Parkville, 3052年维多利亚,澳大利亚
  4. 4癌症和统计方法组,MRC临床试验单位,伦敦NW1 2哒
  5. 5医疗统计单位,伦敦卫生和热带医学学院的伦敦,WC1E 7 ht
  6. 6公共卫生和基层医疗、公共卫生学院、剑桥
  1. 函授:J C Sternejonathan.sterne在{}bristol.ac.uk
  • 接受2009年1月30日

大多数研究有一些缺失的数据。乔纳森·斯特恩和他的同事们描述适当的使用和报告多个归责方法来处理它们

缺失的数据是不可避免的在流行病学和临床研究,但他们的潜在损害的有效性研究结果经常被忽视的医学文献。1这部分是因为缺失的数据引起的统计方法,可以解决问题,直到最近,没有能为医学研究人员利用。然而,多个imputation-a相对灵活,通用的方法来处理缺失数据——现在可以在标准的统计软件,2345使semiroutinely处理缺失数据。结果在此基础上计算密集型方法越来越多的报道,但它需要应用仔细避免误导性的结论。

在本文中,我们审查的原因丢失的数据可能导致偏见和损失在流行病学和临床研究的信息。我们讨论的情况下多个污名可能有助于减少偏见或增加精度,以及描述其应用中潜在的缺陷。最后,我们描述最近的使用和报告分析使用多个归责的医学期刊,并建议指南进行这样的分析和报告。

缺失数据的后果

研究人员通常只包括处理缺失数据的分析完整的情况下,那些人没有缺失数据分析所需的变量。然而,这样的分析可以有偏见的结果。此外,缺失数据在几个变量的累积效应往往会导致排斥的相当大一部分的原始样本,进而造成大量损失精度和权力。

偏见的风险由于缺失的数据取决于数据丢失的原因。缺失数据的原因一般分为:失踪的完全随机(MCAR),随机缺失(MAR),和失踪不是随机(MNAR)(框1)。6这个术语被广泛使用,即使短语表达对他们的技术意义和实际意义,可以微妙。是似是而非的数据丢失时随机的,但并不是完全随机的,分析基于完整的情况下可能会有偏见。这样的偏见是可以克服使用方法等多个参数,允许个人和不完整的数据包括在分析中。不幸的是,它是不可能区分随机丢失,丢失的不随意使用观测数据。因此,偏见造成的数据缺失并非随意可以解决只有通过敏感性分析研究不同的假设缺失数据的影响机制。

盒子1类型的缺失数据*

  • 失踪的完全随机——没有系统缺失值和观测值之间的差异。例如,血压测量可能会丢失,因为故障的自动血压计

  • 随机缺失任何其它系统缺失值和观测值之间的差异可以解释为观测数据的差异。例如,失踪的血压测量可能低于测量血压,但仅仅是因为年轻人更有可能丢失的血压测量

  • 失踪不是随机甚至考虑到观测数据后,系统仍然缺失值和观测值之间的差异。例如,高血压患者更有可能错过诊所预约,因为他们有头痛

处理缺失数据的统计方法

各种特别的方法通常用于处理缺失数据。这些包括取代缺失的值与值估算从观测数据(例如,观测值的均值),使用一个失踪的分类指标,7最后代替缺失值与测量值(去年价值结转)。8这些方法是统计上有效的,它们可以导致严重的偏见。单一的归责缺失值通常导致标准误差太小,因为它无法解释这一事实我们对缺失的值是不确定的。

当有失踪的随机对照试验结果数据,一个常见的灵敏度分析是探索“最佳”和“最差”与“好”的情况下代替缺失值的结果在一个组,另一组“坏”的结果。这可能是有用的,如果只有少数缺失值的二进制的结果,而是因为将所有缺失值好还是坏是一个强大的假设敏感性分析可以给一个非常广泛的干预效应的估计,即使只有中等数量的缺失的结果。当结果定量(数值)这样的敏感性分析是不可能的,因为没有明显的好或坏的结果。

在某些情况下,分析完整的情况下不会导致偏见。缺失数据时只出现在一个结果变量在每个测量一次,那么这种分析将不会有偏见,提供所有变量与结果被失踪可以作为协变量(下一个随机缺失的假设)。缺失的数据在预测变量也不会引起偏差的原因分析完整的情况下,如果缺失的数据与结果无关。910在这种情况下,专家处理缺失数据的方法可以减少损失造成的精度和权力排除个人的不完整的预测变量,但不需要为了避免偏见。

如果我们假设随机数据丢失(框1),然后无偏和统计更强大的分析(相比之下,分析基于完整的情况下)通常可以通过包括个人和不完整的数据。有时这是可能通过构建一个更一般的模型将信息部分观察变量的例子中,使用随机效应模型将部分从中间时间点观察变量的信息1112或通过使用贝叶斯方法合并成一个完整的部分观测变量的统计模型分析可以得到利益。13其他方法包括权重分析,以便丢失的数据,1415和最大似然估计,同时模型的原因丢失的数据和实质性的利益关联分析。13在这里,我们专注于多个归责,这是一个受欢迎的选择这些方法。

多重填补方式是什么?

多个归责的缺失数据问题的一般方法有几种常用的统计软件包。它旨在允许缺失数据的不确定性通过创建几个不同的合理的估算数据集,从他们每个人适当结合的结果。

第一阶段是创建数据集的多个副本,用缺失值取代了估算值。这些样本的预测分布的基础上,观察data-thus多重填补方式是基于贝叶斯方法。归责过程必须充分考虑所有不确定性预测缺失的值由向多个估算值注入适当的可变性;我们永远不会知道的真正价值缺失的数据。

第二阶段是使用标准的统计方法来适应模型的每一个感兴趣的估算数据集。估计协会的估算数据集介绍的会有所不同,因为变化的归责缺失值,平均在一起时,他们只是有用给整体估计关联。标准错误是使用鲁宾的计算规则,16考虑的估算数据集之间的变化结果,反映出缺失值的不确定性。有效推论得到了因为我们是平均分布的缺失数据观测数据。

例如,一项研究调查协会的收缩压与随后的冠心病的风险,数据收缩压的对某些人失踪。收缩压丢失的概率会随着年龄增长而减少(医生更容易衡量老年人),提高身体质量指数,和吸烟史(医生更容易测量它在患有心脏病的风险因素或并发症)。如果我们假设随机数据丢失,我们已收缩压的数据具有代表性的个体在地层年龄、吸烟、体重指数、和冠心病,那么我们可以使用多个归责来估计总体收缩压和冠心病之间的联系。

多重填补方式能够提高医学研究的有效性。然而,多元归责过程需要用户模型与缺失值,每个变量的分布的观测数据。结果从多个归责的有效性取决于这样的造型做仔细的和适当的。多个归责不应该被视为一种常规技术应用的推动button-whenever可能专业统计帮助应该获得的。

在多个归责分析缺陷

最近的一次BMJ文章报道的发展QRISK心血管风险预测工具,基于大型通用实践研究数据库。17研究人员正确识别困难缺失数据的数据库和使用多个归责处理缺失数据的分析。在他们发表的预测模型,然而,心血管风险被发现与胆固醇(编码为总比高密度脂蛋白胆固醇),这是令人惊讶的。18作者随后澄清,当他们限制分析和完整的个人信息(没有缺失数据)之间有一个明显的协会胆固醇和心血管疾病的风险。此外,使用修正后得到相似的结果,改善,归责过程。19因此重要的是要注意的问题,可能发生在多个归责分析,我们在下面讨论。

从归责过程省略的结果变量

经常分析探讨了关联一个或多个预测和一个结果,但一些预测有缺失值。在这种情况下,结果携带信息的缺失值预测和必须使用这些信息。20.例如,考虑一个生存模型相关的收缩压冠心病,拟合数据有缺失值的收缩压。失踪收缩压值估算时,患冠心病的人应该有更大的值,平均而言,比那些仍无病。未能包括冠心病的结果和时间这一结果将丢失的收缩压值会错误地削弱收缩压和冠心病之间的关系。

处理非正态分布的变量

许多多个归责过程假设数据是正态分布的,所以包括非正态分布的变量可能引入的偏见。例如,如果一个生化因素高度偏态分布,但隐式地假定为正态分布,然后归责过程可以产生一些令人难以置信的低甚至是负值。务实的做法是将这些变量近似常态之前归责,然后变换回到最初的规模的估算值。不同的问题时出现数据丢失在二进制或分类变量。一些程序21可能比别人更好地处理这些类型的缺失的数据,13和该领域需要进一步研究。2223

随机缺失假设的合理性

随机“失踪”是一个假设,证明了分析,不是一个属性的数据。例如,随机丢失的假设可能是合理的,如果一个变量预测感兴趣的缺失数据的协变量包含在归责模式,但如果省略变量的模型。多个归责分析将避免偏见只有足够的变量预测缺失值包含在归责模式。例如,如果个人有高社会经济地位都有可能测量收缩压,也不太可能有高收缩压,除非社会经济地位是包含在模型时使用的改动收缩压,多个归罪低估意味着收缩压和可能错误地估计收缩压和冠心病之间的关系。

是合理的归责模型包括一个广泛的变量,包括所有变量在实质性的分析,另外,据计算上可行,所有变量缺失值的预测自己和所有变量影响导致缺失数据的过程,即使他们不感兴趣的实质性的分析。24否则可能意味着随机丢失的假设是不合理的,实质性的分析的结果是有偏见的。

缺失数据不是随机的

一些数据本质上是缺失的不是随机的,因为不可能占系统缺失值和观测值之间的差异使用观测数据。在这种情况下,多个归罪给误导的结果。例如,考虑一个研究调查预测抑郁。如果个人更有可能错过约会,因为他们是抑郁的那天约会,那么它可能无法做随机丢失的假设合理,即使大量的变量是包含在归责模式。当数据丢失不随机,偏见在分析基于多个归罪一样大或比偏差分析的完成情况。不幸的是,它是不可能确定的数据有多大,这可能是一个问题。责任取决于数据分析师要考虑所有可能的原因丢失的数据和评估随机丢失的可能性不是一个严重的问题。

完整的情况下,多个归责分析给出不同的结果,分析师应该试图理解为什么,这应该是发表在出版物上。

计算问题

多个归责是计算密集型和涉及近似。有些算法需要重复运行为了产生足够的结果,和所需的运行长度增加时,更多的数据丢失。算法运行时可能出现不可预见的困难在设置不同于他们开发的示例中,缺失数据的比例高,非常大量的变量,或小数量的观察。这些点更充分地讨论。25

实际意义

的归责模式中使用的原始和修订版本QRISK心血管风险预测工具上面讨论澄清。26的主要原因的意外发现零胆固醇水平和心血管疾病风险之间的关联时遗漏的心血管疾病的结果将丢失的胆固醇值和比率的计算基于估算HDL胆固醇和高密度脂蛋白胆固醇值,导致极端值的比率被包括在评估中。这些缺陷的影响是增加了缺失数据的比例很高(70%的高密度脂蛋白胆固醇值失踪)。

最近文献报道

多重填补方式通常涉及更复杂的统计模型比单一一般回归分析在医学研究论文报道。然而,医学研究论文的长度限制意味着归责过程的细节通常是简短的报道,要么一无所有。同行评议者缺乏熟悉多个污名可能使他们很难问合适的问题使用的方法。

检查最近的使用和报告多个归责,我们搜查了四个主要的通用医学期刊(新英格兰医学杂志》上,《柳叶刀》,BMJ,《美国医学会杂志》)从2002年到2007年的文章报告原始研究结果中多个污名被使用。文章是位于每个期刊的网站上使用搜索功能搜索短语“多个归罪”发表的所有文章的全文中指定的期间。我们发现59文章,报道使用多个归罪大约六年翻了一倍。

总结我们的调查的结果。的多元归责的各种方法,具体方法经常报道只有模糊的(例如一本书参考)。三十六篇报道至少有一部分信息丢失的数据的数量,但只有7个完全或部分报道比较关键变量的分布在个人,没有缺失的数据。的归责基础数据集被报道在22个文件。估算和完整的案例分析结果充分报道只有7个文件,有一个报告敏感性分析。因此很少有可能允许缺失数据的影响进行评估。归责中使用的变量模型很少上市,并随机丢失的假设的合理性是很少评估或讨论。

报告多个归罪在59篇论文发表在医学期刊从2002年到2007年

把这个表:

建议报告指南

在网上补充研究论文的时代,它是可行的和合理的归责为作者提供足够的细节分析促进同行审查,如果没有实质性的分散研究问题。188bet手机版188bet手机版箱2列出了应提供的信息,作为补充品或在主要的论文。这个扩展提供指导的闪光灯倡议加强观察性研究的报道,27和补充建议报告的分析流行病学文献中使用多个归责。28

箱2指南报告任何分析可能影响缺失的数据

  • 报告的数量缺失感兴趣的每个变量的值,或病例数与完整的数据为每一个分析的重要组成部分。给失踪的原因值如果可能,显示有多少人被排除在外,因为缺失数据时通过这项研究报告的参与者。如果可能的话,描述原因缺失数据的其他变量(而不仅仅是报告一个普遍原因如治疗失败)

  • 澄清是否存在个体之间的重要差异与完整和不完整的数据,通过提供一个表比较关键接触和结果变量的分布在这些不同的团体

  • 描述分析用于占缺失数据的类型(例如,多个归责),和所做的假设(如随机缺失)

分析基于多个归责
  • 提供归罪造型的细节:

    • 报告的细节的软件使用和归责造型的关键设置

    • 报告的数量估算数据集创建的(虽然五估算数据集已经被提出充分的理论依据,1011大量(至少20)可能更倾向于减少抽样可变性的归责过程29日)

    • 归责过程变量中包括什么?

    • 非正态分布和二进制/分类变量是如何处理?

    • 如果统计交互是包含在最后的分析,他们还包括在归责的模型吗?

  • 如果大部分的数据是估算的,比较观察和估算值

  • 在可能的情况下,提供分析结果局限于完整的情况下,基于多个归罪与结果。如果有重要的结果之间的差异,建议解释,记住完整的情况下可能遭受更多机会的分析变异,随机丢失的假设下,多个归责应该纠正可能出现的偏差在完整的案例分析

  • 讨论是否归责模式中包含的变量做随机丢失的假设合理

  • 还需要调查关键推论可能的健壮性偏离随机丢失的假设,假设一系列的失踪而不是随机敏感性分析机制。这是一个正在进行的研究领域30.31日

盒3相关建议的指导方针,使用多个归罪在发表的论文中指出,检查的成本效益与标准化疗姑息治疗在晚期非小细胞肺癌患者。

盒3使用多个归责的例子

伯顿等32使用数据从一个随机对照试验比较的成本效益与标准化疗姑息治疗在晚期非小细胞肺癌患者。成本获得了115名患者的一个子集,但完整的只有82例。

他们给了表1中缺失数据的范围和分布的纸。病人和肿瘤特征表示是可比的完整和不完整的数据,但表示不同治疗方法对存活的影响。作者用SAS统计软件中的多重归责过程(PROC MI)归咎于丢失的数据。变量包含在列出的归责模型。五个估算数据集。总运行长度12 500次迭代使用罪名后每2500归责。日志和分对数变换被用来处理non-normality,和一个两阶段的过程被用来处理变量与高比例的零值(半连续分布)。前完成数据被转换回原来的尺度分析。

完整的案例分析导致更高的平均成本化疗与姑息治疗(£2804 (€3285;4580美元),95%置信区间£1236 -£4290)比分析使用多个归责(£2384,95% CI£833 -£3954)。完整的案例分析暗示化疗没有成本效益(平均净货币利益−£3346),但是多个归责分析暗示它是成本效益(平均净货币受益£1186),尽管置信区间宽。

在讨论中,作者指出,多元归责分析”假设不完全随机成本数据丢失的missingness组件成本只与观测数据相关联,协变量观察或有效性。然而,“他们没有讨论是否随机丢失的假设是合理的或进行敏感性分析调查结果的鲁棒性假设失踪不是随机机制。

总结

我们热衷于潜在的多个归责和其他方法14提高医学研究结果的有效性,减少资源的浪费造成的丢失的数据。多个归责的成本分析与成本相比是小的收集的数据。这将是一个遗憾,如果多个归责的可避免的陷阱进展放缓更广泛的使用这些方法。它不再是可原谅的缺失值和他们出现的原因被掩盖起来,也潜在的误导和效率分析的完整情况下被认为是足够的。我们希望这里讨论的陷阱和指导方针将为合理使用和报告的方法来处理缺失数据。

笔记

引用这个:BMJ2009;338:b2393

脚注

  • 我们感谢露辛达比林汉姆检查文章的描述中描述框3。

  • JBC贡献者:江淮,IRW,联合研究中心的写论文的初稿。女士进行了审查的使用多个归罪在医学期刊和分析数据。所有作者的论文的最终稿和随后的改写。江淮、IRW和联合研究中心将作为担保人

  • 资金:由英国医学研究理事会授予G0600599。IRW支持和MRC格兰特U.1052.00.006的JBC NHMRC(澳大利亚)拨款334336。

  • 利益冲突:没有宣布。

  • 出处和同行评审:不是委托;外部同行评议。

这是一个开放分布式根据条创作共用署名非商业性的许可证,允许使用,分布,在任何介质,和繁殖提供了最初的工作是正确地引用,使用非商业,否则按照许可证。看到的:http://creativecommons.org/licenses/by-nc/2.0/http://creativecommons.org/licenses/by-nc/2.0/legalcode

引用