用于医疗保健专业人员

教育和辩论

荟萃分析偏见在位置和选择的研究

BMJ1998年;316年doi:https://doi.org/10.1136/bmj.316.7124.61(1998年1月3日发表)引用这个:BMJ316:61 1998;
  1. 马提亚症,读者在社会医学和流行病学一个(m.egger在{}bristol.ac.uk),
  2. 乔治大卫史密斯临床流行病学教授一个
  1. 一个社会医学、布里斯托大学、布里斯托尔BS8 2公关
  1. 函授:Egger博士

    选手

    荟萃分析自一开始就收到反应不一。有些人拒绝了他们所看到的是练习“mega-silliness。”1而一系列非常杰出的荟萃分析的供应商的围产期医疗2被认为是“一个产科“巴德尔•迈因霍夫帮”。3一些临床医生反对荟萃分析的结果,“一个工具已经成为一种武器。”4在光谱的另一端,应用技术,主要包括计算加权平均被誉为“牛顿”,5它已经表明,荟萃分析没有叙事评论文章。6真相可能是这些极端观点之间的某处。

    总结分

    • 偏见可以在许多方面引入定位和选择的过程的研究列入荟萃分析

    • 重要研究结果更有可能得到比没有显著的研究成果,发表发表偏倚

    • 在已发表的研究中,那些重要的结果更有可能得到发表在英语,更有可能被引用,并更有可能重复发表,导致英语语言偏见,引文偏见,和多个发表偏倚

    • 在欠发达国家,研究与重要的结果更有可能得到发表在期刊文献数据库索引,可以介绍数据库的偏见

    • 包括标准研究的荟萃分析可能影响知识的潜力研究的结果,导致包含偏见

    • 可能存在与否的偏差应经常检查敏感性分析和漏斗图

    ,分析潜在的问题可以通过对比两个荟萃分析的结论比较低分子量肝素和标准肝素预防手术后血栓形成。78一组得出的结论是,“低分子量肝素似乎有更高的效益风险比未分离肝素在预防围手术期血栓形成,”7而另一方认为“目前没有令人信服的证据,在普通外科病人低分子量肝素,与标准肝素相比,生成一个临床上重要的改善效益风险比。”8这些荟萃分析之间存在各种差异,但主要的区别与包含选择的研究(1)。Nurmohamed等他们的分析基于试验的子群,他们认为拥有最高的方法论的力量,8而Leizorovicz等包括所有试验分析。71显示许多其他元素的例子中,语言的限制或使用未发表的材料可以有助于对比结论。

    特征的两个荟萃分析的低分子量肝素预防手术后血栓形成

    把这个表:

    发表偏倚

    最明显的问题是,一些研究也不会出版的。如果研究的原因仍未与他们相关联的结果然后可能严重偏向一个荟萃分析的结果。没有实际的假设,假定的治疗对疾病的影响,研究表明有益的影响可能会被发表,而同等质量的数据指向另一个方向可能仍未公布。在这种情况下发表试验的荟萃分析确定一个虚假的有益的治疗效果。领域的癌症化疗这确实已被证明,在比较研究中确定一个文献检索的结果与国际试验中包含注册表9(盒子)。

    发表偏倚的示范

    • 重要研究结果更有可能得到发表比非重大的结果

    • 包含的研究试验注册可以认为不影响它的结果因为登记通常发生之前完成这项研究

    • 研究加入了一个寄存器因此可能会构成更多的代表性样本的研究一直在进行一个给定区域的样本已发表的研究

    • 这一原则已经测试了试验不同的癌症化疗通过比较试验的荟萃分析的结果确定试验的文献搜索和注册国际癌症研究数据库(4)9

    返回文本

    这种发表偏倚的问题在教育研究和心理学关注了30年。101112工作在医学文献发表偏倚的存在和重要性是最近的。五个独立研究通过跟踪调查研究方案经伦理委员会批准。13141516285年的一个研究伦理委员会批准的研究在1984年到1987年之间已经完成和分析,138名(48%)在1990年出版。研究结果显著(P < 0.05)更有可能比那些与已发表的结果。13所有五个研究的荟萃分析显示,这是一个一致的发现,几乎没有研究之间的异质性(图1)。出版三次结果的可能性更大,如果结果显著(综合优势比为3.0,95%置信区间2.3 - 3.9),和发表偏倚被发现为临床试验和观察性研究。有趣的是,研究继续出现在印刷多年后得到伦理委员会的批准。船尾et al(伦理委员会E)发现,大约85%的研究与重要的研究结果相比,65%零结果已经出版十年之后。16出版时间中位数是4.8年研究与研究的重要结果和8.0年零的结果。

    ">图1
    图1

    荟萃分析的五个研究协会的重要成果和发表的研究提案提交给伦理委员会。未经调整的优势比是利用固定效应模型相结合

    资金的来源与出版或者干脆不独立的研究结果。131416研究由制药行业不太可能比由政府或发表的志愿组织,与调查人员称这些公司的数据管理是干脆不的原因。1314这是在协议的审查出版物的临床试验分组成那些由制药行业和那些支持通过其他方式。1789%的免费餐发表的试验的结果支持在单一疗法结合化疗烷化剂,相比之下,61%的其他试验。类似的结果已报告从试验的非甾体抗炎药的概述。18言下之意是,制药业阻碍了研究它的出版资助的负面结果。最后,多中心的研究更有可能比从单一研究中心出版。14然而,高质量的试验不可能发表比试验的低质量。13

    选择性提交的论文,而不是选择性接受的论文期刊发表偏倚的主导因素。13141516然而,选择性接受发生了一个主要的“作者”一节对糖尿病》杂志上说,“仅仅是确认已知事实只在异常情况下将被接受;这同样适用于实验和观察的报告没有积极的结果。”19许多作者不得提交研究负面的结果,因为他们预期拒绝。

    偏见在位置的研究

    尽管发表偏倚的一直认可10和讨论,20.21其他因素会引起偏见的研究纳入荟萃分析。确实在已发表的研究中,确定相关试验的荟萃分析的概率也受到他们的结果。这些偏见比发表偏倚收到较少的考虑,但是他们的后果可能是同样重要的。

    英语的偏见

    荟萃分析发表在英文期刊上往往只根据试验用英语发表。例如,36个荟萃分析发表在领先的英语一般医学期刊从1991年到1993年,26日被搜索英文研究报告。22调查人员在非英语国家工作,然而,在当地期刊上发表他们的一些工作。232425作者可能更有积极的结果在国际报道,英语杂志和消极的结果在当地的杂志。偏见可能会因此被引入荟萃分析仅基于英文报告。2224

    我们已经检查了这个问题对文学发表在德国。所有发表的随机对照试验五个德国,瑞士,奥地利一般医学期刊从1985年到1994年被确定在一个手动搜索。25然后Medline数据库搜索随机对照试验相同的10年期间发表在英语。26比较对相同的第一作者发表的论文发现,63%的试验用英语发表了显著(P < 0.05),试验发表在德国这一比例为35%。在逻辑回归分析英文出版的赔率是3.8(95%可信区间1.3到11.3)倍,如果结果是显著的。这种关联变动不大时调整的研究样本大小,设计和质量。事实上,质量分数密切相似的英语和德语语言报告。26这些发现表明出版物的随机试验从德国在欧洲,一个英语的偏见存在,忽略试验发表在德国是有问题的。同样的情况可能与其他语言,尤其是欧洲语言。

    数据库的偏见

    而大多数西方欧洲的主要期刊,发表在除英语之外的其他语言索引Embase或Medline,这不是期刊发表在欠发达国家。在3000年到4000年期刊索引Medline、Embase,或科学引文索引,只有2%来自欠发达世界。27例如,只有30期刊的Medline收录的3861种期刊发表在印度,尽管印度是发展中国家最大的科研产出28和它的医学研究发表在英语。研究发表在期刊索引在数据库的一个主要意味着这些数据实际上是评论家和meta-analysts隐藏。少数试验将发表在本地或国际期刊索引,但结果和其他特征这两个组之间可能会有所不同。的确,试验与显著的结果可能会更容易在索引期刊出版,而试验与零结果发表在非索引期刊。

    引用的偏见

    在定位的研究中,研究人员经常补充计算机数据库的搜索通过联系该领域的专家和检查的参考书目中其他的研究和评论。当使用参考列表时,引用偏见可能有一个重要的角色。领域的胆固醇降低,支持有益的试验更频繁地引用比很多试验,无论大小和质量的研究29日(盒子)。因此,使用的参考列表将更有可能找到支持研究,这可能偏差分析的结果。

    引用和选择偏差的研究

    7个试验的荟萃分析心肌梗死后降低胆固醇30.它的入选标准定义为单因素随机试验每组至少有100名参与者,至少有三年的跟进,不使用激素治疗降低胆固醇。汇集所有原因的死亡率的结果显示一个有利的趋势(优势比为0.91,95%可信区间0.82到1.02)(5)。

    ">装具

    结果包括,错过了,排除试验的荟萃分析心肌梗死后降低胆固醇30.

    一个试验遇到的所有入口准则,但不包括在内。31日在这项研究中整体死亡率的优势比是一个不利的1.60 (0.95 - 2.70)。试验包括在分析期间的年平均引文数/研究五年后出版20;的研究是不包括小于1。29日引用的偏见已经扭曲的这项荟萃分析的结果。

    另外十一个二级预防试验当时可用但没有满足有些武断的入选标准。32所有原因的死亡率的集中优势比这些试验是1.14 (1.03 - 1.26)。包含偏见已经影响了这个荟萃分析的结论。

    的期刊论文发表也可以影响缓解他们的位置和包容的荟萃分析。一个有影响力的降低胆固醇试验,例如,最初是作为一项研究计划的一级预防和二级预防的手臂。34初级预防组件的结果被调查者是有利的解释,和研究结果发表在新英格兰医学杂志》上在1987年。35二级预防手臂同时完成,但是在这种情况下,结果显然是不利的。36研究结果从这个手臂直到1993年才被出版,医学年鉴,36一个有限循环》杂志上。这篇论文的新英格兰医学杂志》上收到了450多引用该书出版后的三年,而这篇文章的医学年鉴收到17。

    多个发表偏倚

    多个出版物从单一的研究在很多方面会导致偏见。37重要研究结果更有可能导致多个出版物和报告,13这使得它更有可能的是,他们将找到并包含在一个荟萃分析。此外,包含重复数据可能导致过高的治疗效果,最近联合试验显示,5-HT3受体拮抗剂,用于预防和治疗术后恶心和呕吐。38它并不总是显而易见的多个出版物来自一个研究中,和一组研究对象可能因此被纳入一个分析两次。这是一个特别的问题在多中心试验。在一个荟萃分析的低分子量肝素,8例如,似乎从多中心试验中,结合数据与相同的数据的一个子集,也曾报道分别从个人中心,促成了审判。39事实上,它可能很困难,如果不是不可能的话)对meta-analysts确定两篇论文表示重复的出版物的审判或两个独立的试验,为例存在两篇文章报告相同的试验不共享一个共同作者。373840

    偏差在规定的数据

    没有报告在打印常常需要一些额外的数据对于meta-analysis-for示例,在报告的情况下,不提供足够的分层但总可能很难获得这些信息。许多因素可能影响的意愿调查数据可用,但一个元素可能结果的方向。等提供数据偏差也可能发生在未发表的试验或试验的情况下发表会议摘要。

    有偏见的入选标准

    尽管研究可能是位于和获得的数据,潜在的偏见仍可能出现在建立一个荟萃分析的入选标准。如果像往常一样,入选标准是由一名调查员熟悉研究下的面积的标准可以通过知识的结果影响的研究潜力。操纵入选标准可能导致选择性的研究和积极的研究发现和排除消极结果。例如,一些降低胆固醇治疗试验的荟萃分析排除某些研究,理由是所使用的治疗似乎有不利影响的降低胆固醇本身独立的。4142然而,这些荟萃分析,包括试验的治疗,可能会影响积极冠心病的风险,独立于胆固醇降低。显然这样一个不对称的方法介绍了选择性偏差的可能性,荟萃分析的入选标准是来自研究结果(见盒子引用和选择性偏差)。

    一个最近的例子涉及到试验的荟萃分析膳食干预在社区设置。43作者被审判,因为随机过程被认为是不够的,但是他们包括重复发表相同的试验几乎相同的随机过程的描述。44两个独立的观察员评估资格的试验,第三作者分歧得到解决。这个例子展示了如何脆弱的遴选过程可以在荟萃分析。

    检查的偏见

    最合适的处理方式的选择研究是包括所有的研究,满足基本进入标准然后执行敏感性分析对不同的可能的进入标准。任何结论从一个高度敏感的荟萃分析改变入口准则应谨慎对待。除了这样的敏感性分析,可能的偏差应该检查是否存在漏斗图的图形。

    ">图2
    图2

    漏斗图的死亡率从试验结果β受体阻滞剂在二级预防心肌梗塞。优势比策划反对研究样本大小

    漏斗图

    漏斗plots-simple散点图试验效果的估计与样本大小是有用的分析检测的偏见。45漏斗图精度评估是基于事实基础治疗效果会增加组件研究样本量的增加。从小型研究结果必将广泛分散在图的底部。之间的传播将会缩小随着精度的增加更大的研究。因此没有偏见,情节应该像一个对称的倒漏斗。如果情节展示了一个不对称和倾斜的形状,可能存在偏差。这通常需要一个缺口的形式在宽漏斗的一部分,这表明没有小研究显示没有任何好处或伤害。漏斗图是一种图形化测试任何类型的偏见与样本大小(相关联盒子)。出版本文中描述和位置偏差的研究更有可能影响小于大型试验,可能因此导致漏斗图不对称。不对称的另一个原因来自于不同的方法学质量。平均,较小规模的研究和分析进行方法论的严格小于较大的研究和试验,低质量展示出更大的效果。46统计方法提供一个客观的衡量漏斗图不对称最近变得可用。4547

    偏见在荟萃分析,可以发现在漏斗的情节

    • 发表偏倚

    • 位置偏差:

    • 英语的偏见

    • 数据库的偏见

    • 引用的偏见

    • 多个发表偏倚

    • 偏差在规定的数据

    • 可怜的小研究的方法学质量

    返回文本

    心肌梗死后example-ß阻滞剂

    在本系列中,我们已经多次讨论了17个试验的荟萃分析评估β受体阻滞剂在二级预防心肌梗塞。我们之前提出的灵敏度分析48显示结果的统计方法的选择和排除试验的质量或提前终止的研究。漏斗图显示在图3。视觉评估显示一些不对称,这表明有选择性干脆不小型试验用更少的相当大的好处。然而,在正式的统计分析4547不对称的程度被发现是小而非重要(P > 0.1)。此外,排除较小的研究几乎没有对总体估计的影响。48偏见并不因此似乎扭曲这一荟萃分析的结果。

    结论

    偏见在出版、位置和包容是荟萃分析的一个潜在的严重问题495051至关重要的考试这种偏见的存在在灵敏度和漏斗图分析应形成一个荟萃分析的主要部分。45Cochrane协作的努力找出尽可能多的对照试验通过手动搜索大量医学期刊发表在许多不同的语言就是这样重视减少偏见。事实上,科克伦对照试验注册52现在可能是最好的单一来源发表的试验包含在系统评价和荟萃分析。消除发表偏倚的风险,然而,试验时需要注册成立。确保登记、伦理批准研究可能与要求试验中心登记。334953此外,完成试验的结果可以提交给伦理委员会的报告可以保持集中,未发表的试验可以请求发送到这个身体。然而,目前仍然需要很多努力以确保一组位于一个荟萃分析的研究并不是一个有偏见的所有现有的研究样本。

    确认

    社会医学部门在布里斯托尔大学的医学研究委员会的卫生服务研究合作。

    引用

    1. 1。
    2. 2。
    3. 3所示。
    4. 4所示。
    5. 5。
    6. 6。
    7. 7所示。
    8. 8。
    9. 9。
    10. 10。
    11. 11。
    12. 12。
    13. 13。
    14. 14。
    15. 15。
    16. 16。
    17. 17所示。
    18. 18岁。
    19. 19所示。
    20. 20.
    21. 21。
    22. 22。
    23. 23。
    24. 24。
    25. 25。
    26. 26岁。
    27. 27。
    28. 28。
    29. 29。
    30. 30.
    31. 31日。
    32. 32。
    33. 33。
    34. 34。
    35. 35。
    36. 36。
    37. 37岁。
    38. 38。
    39. 39岁。
    40. 40。
    41. 41岁。
    42. 42。
    43. 43。
    44. 44岁。
    45. 45岁。
    46. 46岁。
    47. 47岁。
    48. 48。
    49. 49。
    50. 50。
    51. 51。
    52. 52岁。
    53. 53岁。