广告
  • 加载指标

棱镜声明报告系统评价和荟萃分析的研究,评估卫生保健干预措施:解释和细化

  • 亚历山德罗Liberati,

    alesslib@mailbase.it

    从属关系意大利摩德纳di e Reggio Emilia,摩德纳,意大利,Centro Cochrane犬,史Ricerche Farmacologiche马里奥·内格里,米兰,意大利

  • 道格拉斯·g·奥特曼

    联系医学统计中心,牛津大学,英国牛津大学

  • 泰兹拉夫詹妮弗。

    联系渥太华方法中心,渥太华医院研究所,加拿大安大略省渥太华

  • 辛西娅·Mulrow

    联系内科医学年鉴》上发表的费城,宾夕法尼亚州,美国

  • 彼得·c·Gøtzsche

    联系北欧Cochrane中心,哥本哈根,丹麦

  • 约翰·p·a·埃尼迪斯,正把

    联系卫生和流行病学、约阿尼纳大学医学院的约阿尼纳,希腊

  • 迈克•克拉克

    从属关系英国英国Cochrane中心,牛津学院的护理和助产,爱尔兰都柏林三一学院

  • p . j .审视中国

    联系医学、临床流行病学和生物统计学,麦克马斯特大学,加拿大安大略省汉密尔顿市

  • 乔斯Kleijnen,

    从属关系Kleijnen系统评价,纽约、英国、学校公共卫生和基层医疗(CAPHRI),马斯特里赫特,荷兰马斯特里赫特大学

  • 大卫·莫赫

    从属关系渥太华方法中心,渥太华医院研究所,加拿大安大略省渥太华的流行病学和社区医学,医学院,加拿大安大略省渥太华

棱镜声明报告系统评价和荟萃分析的研究,评估卫生保健干预措施:解释和细化

  • 亚历山德罗Liberati,
  • 道格拉斯·g·奥特曼
  • 泰兹拉夫詹妮弗。
  • 辛西娅·Mulrow
  • 彼得·c·Gøtzsche
  • 约翰·p·a·埃尼迪斯,正把
  • 迈克•克拉克
  • p . j .审视中国
  • 乔斯Kleijnen,
  • 大卫·莫赫
公共科学图书馆
x

文摘

系统评价和荟萃分析总结至关重要的证据有关卫生保健干预措施的有效性和安全性准确、可靠。这些报告的清晰度和透明度,然而,不是最佳的。可怜的报告系统评价减少了他们价值的临床医生、政策制定者和其他用户。

因为QUOROM的发展(实施专业化OfReportingOfeta-analysis)报表报告指南出版于1999年,已经有几个概念,方法,和实际的进步有关的行为和报告系统评价和荟萃分析。同时,评论发表的系统评价发现,关键信息报道这些研究往往不佳。意识到这些问题,一个国际集团,其中包括经验丰富的作者和方法学家开发了棱镜(首选项报告系统评价和荟萃分析)作为一个进化的原始QUOROM指南系统评价和荟萃分析评价的卫生保健干预措施。

棱镜语句由一个27-item清单和一个四阶段流程图。清单包括项目视为必不可少的透明的报告系统回顾。我们在这个文档的理解和阐述,解释每个清单项目的意义和基本原理。对于每个项目,我们包括良好的报告和一个例子,在可能的情况下,引用相关的实证研究和方法论的文学。棱镜的声明,这个文档,和相关的网站(http://www.prisma-statement.org/)应该有用的资源来改善报告系统评价和荟萃分析。

介绍

系统评价和荟萃分析是必不可少的工具,总结准确、可靠地证据。他们帮助临床医生保持最新的;为政策制定者提供证据来判断风险,福利,医疗行为的危害和干预措施;聚集在一起为病人和他们的照顾者和总结相关研究;为临床实践指南的开发人员提供一个起点;提供总结之前的研究资助者希望新研究的支持[1];并帮助编辑法官发布最新研究报告的优点[2]。最近的数据表明,至少有2500新的系统评价报告在英语在MEDLINE每年索引[3]

不幸的是,有相当多的证据表明,关键信息往往缺乏系统评价报告,从而减少其潜在效用[3],[4],[5],[6]。适用于所有研究,系统评价应充分报道,透明地让读者评估调查的优点和缺点[7]。理由导致QUOROM的发展(实施专业化OfReportingOfeta-analyses)声明;这些详细的报告建议于1999年出版[8]。在本文中,我们描述了更新的指导。我们的目标是确保清晰的计划,在系统回顾,发现。

术语用于描述系统评价和荟萃分析随着时间的推移演变和变化在不同组的研究人员和作者(见箱1)。在本文中,我们采用的定义由Cochrane协作使用[9]。系统回顾尝试所有的经验证据收集符合预先确定合格标准回答一个特定的研究问题。选择它使用显式的、系统的方法,以减少偏见,从而提供可靠的研究结果可以得出的结论和决定。荟萃分析是使用统计方法总结,结合独立研究的结果。许多系统评价包含荟萃分析,但不是全部。

框1。术语

使用的术语来描述系统评价和荟萃分析的发展随着时间的推移和之间的不同领域。不同的条款已被不同的团体,比如教育家和心理学家。系统回顾的行为由几个明确的和可再生的步骤,如识别所有可能相关的记录,选择符合条件的研究,评估偏差的风险,提取数据,包括定性的综合研究和荟萃分析。

最初的整个过程称为荟萃分析,所以QUOROM语句中定义[8]。最近,尤其是在医疗研究,有趋势倾向于系统综述。如果执行定量合成,这最后阶段单独称为一个荟萃分析。Cochrane协作使用这个术语[9],一个荟萃分析,如果执行,系统回顾的一个组成部分。不管问题和复杂问题的解决,它总是可以完成系统回顾现有的数据,但并不总是可能的,还是可取的,定量合成的结果,由于临床,包括研究方法论,或统计差异。相反,与潜在的研究和数据积累计划最终将他们的,“(潜在)荟萃分析”这个词可能比“系统综述。”更有意义

回顾工作,一种可能性是使用术语系统回顾整个过程到当一个人决定是否执行定量合成。如果执行定量合成,一些研究人员将这称为一个荟萃分析。这个定义类似于当前的版本字典的流行病学[183]

虽然我们认识到,这些术语的使用是不一致的,剩余工作小组的成员之间的分歧在棱镜上,我们采用了使用的定义Cochrane协作[9]

系统回顾:系统回顾尝试所有的经验证据收集符合预先确定合格标准回答一个特定的研究问题。选择它使用显式的、系统的方法,以减少偏见,从而提供可靠的研究结果可以得出的结论和决定[184],[185]。系统综述的主要特征是:(a)一套明确的目标明确,可再生的方法;(b)系统搜索,试图识别出所有的研究,将满足合格标准;(c)的评估包括研究的结果的有效性,例如通过偏见的风险评估;和(d)系统的演示,合成,包括研究的特点和结果。

荟萃分析:荟萃分析是使用统计技术集成和总结了研究的结果。许多系统评价包含荟萃分析,但不是全部。从所有相关的研究,结合信息荟萃分析可以提供更精确的估计的影响比来自个人医疗保健研究包括在审查。

QUOROM语句及其进化成棱镜

QUOROM语句,发达国家在1996年和1999年出版[8],是报告指导作者报告随机试验的荟萃分析。188bet手机版188bet手机版自那以来,发生了很多。首先,知识进行系统评价和报告已经大大扩大。例如,Cochrane图书馆的方法注册(包括报告的研究相关的系统评价方法)现在包含超过11000个条目(2009年3月)。第二,有许多概念上的进步,如“产出水准”风险评估的偏见[10],[11],适用于系统评价。第三,作者已经越来越多的应用系统评价总结证据其它比随机试验。

然而,尽管进步,实施和报告的审查的质量远远没有理想[3],[4],[5],[6]。所有这些问题促使需要更新和扩大QUOROM声明。值得注意的是,认识到更新语句现在地址上面的概念和方法论的问题,也可能比原来的更广泛的适用性QUOROM声明,我们改变了报告的名称指导棱镜(首选项报告系统评价和荟萃分析)。

棱镜的发展

棱镜的声明是由一群29日评论作者方法学家、临床医生、医学编辑,和消费者[12]。他们在2005年参加了一个为期三天的会议,参与广泛会后电子信件。达成共识的过程,被告知的证据,只要有可能,被用来开发一个27-item清单(表1;另请参阅文本S1为研究人员重用模板下载清单)和一个四阶段流程图(图1;看到图S1为一个可下载的模板文档人员重用)。物品被视为必不可少的透明的系统回顾报告是包含在清单中。流程图最初提出的QUOROM也修改为显示数量的确认记录,排除文章,包括研究。11修订集团批准后检查表,流程图,这说明纸。

缩略图
图1所示。流的信息通过系统回顾的不同阶段。

https://doi.org/10.1371/journal.pmed.1000100.g001

棱镜语句本身提供了更多细节关于其背景和发展[12]。这个附带的解释和细化文档解释了每个清单项目的意义和基本原理。几棱镜组参与者自愿帮忙起草具体项目文档,和四个(DGA,艾尔,DM和JT)见了几次,进一步完善文档,这是流传并最终批准的大棱镜组。

缩略图
表1。检查表的项目包括在报告系统回顾(有或没有荟萃分析)。

https://doi.org/10.1371/journal.pmed.1000100.t001

棱镜的范围

棱镜关注作者可以确保透明和完整的系统回顾和荟萃分析报告。它不处理直接或详细的方式进行系统评价,为其他指南[13],[14],[15],[16]

我们开发了棱镜语句和这个说明文档,帮助作者报道一系列广泛的系统评价,评估医疗干预的好处和坏处。我们认为大部分的清单项目相关报告非随机研究的系统评价评估干预措施的好处和坏处。然而,我们认识到,作者解决问题涉及病因学、诊断、预后,例如,流行病学或诊断准确性研究可能需要修改或将额外项目的系统评价。

如何使用这篇文章吗

我们模仿这个文档的理解和阐述后准备其他报告指南[17],[18],[19]。本文档的利益最大化,我们鼓励人们阅读它会同棱镜声明[11]

我们现在每个清单项目和跟随它发表范例项目的好报告。(我们编辑通过删除引用一些例子或网址,或通过拼写缩写。)然后我们解释相关的问题,包括项目的基本原理,从文献和相关证据,只要有可能。没有系统的搜索进行了识别原型和证据。我们还包括7盒提供了一个更全面的解释某些主题方面的系统评价的方法和行为。

虽然我们专注于最小的项目列表时要考虑报告系统回顾,我们显示额外信息的地方需要提高透明度的审查过程。我们目前的项目数字从1到27个;然而,作者不需要解决项目在这个特定的顺序在他们的报告。相反,重要的是每个项目的信息给出报告内的某个地方。

棱镜清单

标题和摘要

项目1:标题。

确定报告作为一个系统的回顾,荟萃分析,或两者兼而有之。

的例子。“胸腔镜与开放手术的复发率pneumothoraces复发的预防:系统回顾的随机和non-randomised试验”[20]

“死亡率随机试验的抗氧化补充剂的初级和二级预防:系统回顾和荟萃分析”[21]

解释。

作者应该确定他们的系统回顾和荟萃分析报告。“审查”或“概述”等术语不为读者描述审查是否系统还是一个荟萃分析。最近的一项调查发现,50%的300年作者没有提到“系统综述”或“荟萃分析”条款的标题或抽象系统的审查[3]。虽然敏感搜索策略开发识别系统评价[22],包含系统审核或荟萃分析的标题可以提高索引和识别。

我们建议作者使用的标题,使关键信息容易被读者理解。理想情况下,一个标题反映了海岸边的方法(参与者,干预措施,比较器,结果,和研究设计)(参见11项框2)可以帮助读者,因为它提供了关键的信息审查的范围。指定的设计(s)研究包括在内,如例子所示,也可以帮助一些读者和搜索数据库。

箱2。帮助开发研究的问题(s):海岸边的方法

制定相关的和精确的问题,可以回答在系统回顾可以复杂和耗时。结构化方法的框架问题,使用五个组件可以帮助促进这一过程。这种方法通常以每个字母缩写“海岸边”,指的是一个组件:患者人群或疾病被解决(P),干预或暴露(I),比较器组(C)、结果或端点(O),选择的研究设计(S)[186]。相关问题几个棱镜项(即海岸边的影响。6、8、9、10、11、18)。

提供的信息人口需要精确定义的一组参与者(通常是病人),如男性年龄在65年,他们感兴趣的特征(通常是疾病),和可能的设置护理,如急性护理医院。

干预措施(暴露)正在考虑在系统回顾需要透明的报道。例如,如果审查员回答一个关于一个女人之间的关系问题的产前接触叶酸和随后的后代的神经管缺陷,报告剂量、频率和持续时间的不同研究中使用叶酸可能重要的读者解释评审的结果和结论。其他干预(曝光)可能包括诊断、预防、治疗或治疗,安排具体的护理过程,改变生活方式,心理教育干预或危险因素。

清晰的报告比较器(控制)组干预(s),如常规治疗、药物或安慰剂,对读者完全理解至关重要的选择标准主要包括在系统评价的研究,并且可能是异质性的来源调查人员必须处理。比较器通常很少被描述。清楚报告的干预相比是非常重要的,有时可能会产生影响的研究在review-many评论与“标准治疗,”否则定义;这应该是作者妥善解决。

结果干预的评估,如死亡率,发病率,症状,或生活质量的改善,应该明确指定为他们被要求解释的有效性和普遍性的系统审查的结果。

最后,的类型研究设计(s)包括在审查应该报道。有些评论只包括随机试验的报告而产生更广泛的设计标准,包括随机试验和某些类型的观察性研究。还有其他评论,比如专门回答问题与伤害有关,可能包括各种各样的设计从队列研究案例报告。无论研究设计是包括在审查,这些应该报道。

独立于有多难确定研究问题的组件,重要的是一个结构化的方法是可取的,这超越了系统评价的有效性。理想的海岸边的标准应该预先制定,系统回顾的协议,虽然有些可能需要修订评审过程的迭代性质。作者鼓励报告他们的海岸边标准及是否需要在评审过程中进行修改。一个有用的例子在这个领域的附录“水氟化反应的系统评价”进行评论和传播的中心[187]

一些期刊推荐“指示性标题”表明这个话题的评论,而其他人则需要声明标题给评审的主要结论。繁忙的从业者可能更愿意看到标题中评审的结论,但声明的标题可以过度简化或夸大的发现。因此,许多期刊和方法学家喜欢显示标题,在上面的示例中使用。

项目2:结构化的总结。

提供一个结构化的总结,包括适用:背景;目标;数据来源;合格标准研究,参与者,干预措施;研究评价和合成方法;结果;限制;结论和影响的主要结论;资金系统综述;和系统综述登记号码。

的例子。上下文:角色和剂量的口服维生素D补充nonvertebral骨折预防尚未完善。

客观的:估计的有效性补充维生素D在预防老年人髋关节和nonvertebral骨折。

数据源:系统回顾英语和非英语的文章利用MEDLINE和Cochrane对照试验注册(1960 - 2005),和EMBASE (1991 - 2005)。额外的研究发现通过联系临床专家和参考书目和抽象在美国社会寻找骨和矿物质研究(1995 - 2004)。搜索条件包括随机对照试验(RCT),对照临床试验,随机分配,双盲法、维生素d3、维生素d2,人体内25 -羟维生素D,骨折,人类,老年人,瀑布,骨质密度。

研究选择:只有口服维生素D补充剂的双盲相关(维生素d3、维生素d2)有或没有补充钙和钙补充或安慰剂在老年人(> 60岁),检查或nonvertebral髋骨骨折包括在内。

数据提取2:独立提取文章的作者使用预定义的数据字段,包括研究质量指标。

数据合成:汇总分析都是基于随机模型。5相关的髋部骨折(n = 9294)和7 nonvertebral骨折风险的相关(n = 9820)满足我们的入选标准。所有试验使用维生素d3。之间的异质性研究髋关节和nonvertebral骨折预防观察,与低剂量后消失池相关的维生素d(400国际单位/ d)和高剂量(700 - 800 IU / d),分别。700到800国际单位的维生素D剂量/ D的相对危险度(RR)降低髋部骨折26%(3相关的有5572人;汇集RR 0.74;95%可信区间(CI), 0.61 - -0.88)和任何nonvertebral骨折23%(5相关的有6098人;汇集RR 0.77;95%可信区间,0.68 - -0.87)和钙或安慰剂。没有明显的好处是观察相关400 IU维生素d / d(2相关的有3722人; pooled RR for hip fracture, 1.15; 95% CI, 0.88–1.50; and pooled RR for any nonvertebral fracture, 1.03; 95% CI, 0.86–1.24).

结论:口服维生素D补充700到800国际单位/ D似乎减少臀部和任何nonvertebral骨折的风险动态或制度化的老年人。口服剂量的400 IU维生素D / D骨折预防是不够的。”[23]

解释。

摘要提供关键信息,使读者能够理解的范围,过程和结果的审查和决定是否阅读报告全文。抽象的可能都是现成的读者,例如,在书目数据库。抽象应该提供一个平衡的和现实的评估审查发现的镜子,虽然时间很短,报告的主要内容。

我们同意别人的质量报告摘要发表在会议和期刊出版物需要改进[24],[25]。虽然我们不均匀偏爱特定格式,我们一般推荐结构化的抽象。结构化的抽象为读者提供一系列标题有关目的、行为,发现和结论的系统性回顾报告[26],[27]。他们给读者更完整的信息和方便查找信息更容易比非结构化的抽象[28],[29],[30],[31],[32]

一个高度结构化的抽象的系统回顾可能包括以下标题:上下文(或背景);目标(或目的);数据来源;研究选择(或合格标准);研究评价和合成方法(或数据提取和数据合成);结果;限制;和结论(或影响)。或者,一个更简单的结构可以覆盖但崩溃的一些上面的标题(例如,标签选择和研究评估,评估方法)或省略一些标题如背景和局限性。

在上面提到的高度结构化的抽象,作者使用背景为读者和标题设置上下文解释评审问题的重要性。下目标的标题,他们理想的使用元素的海岸边(见框2)国家审查的主要目的。在一个数据源搜索标题,他们总结来源,任何语言或出版物类型限制,搜索的开始和结束日期。研究选择语句然后使用什么理想的描述所选研究入选标准。数据提取方法语句描述评价方法在数据抽象和用于集成的方法或总结数据。的数据合成部分是主要审查报告的结果。如果评审包括荟萃分析,作者应该提供数值结果与置信区间的最重要的结果。理想情况下,他们应该在这些分析指定数量的证据(数字与数字的参与者)的研究。在一个限制标题,作者可能描述最重要的弱点包括研究以及评审过程的局限性。然后作者应该提供清晰和平衡结论密切相关的目标和结果的审查。此外,它会有帮助,如果作者包括一些资金审核信息。最后,尽管协议注册系统评价仍然是不常见的做法,如果作者有注册审查或收到一个注册号,我们建议提供注册信息的抽象。

考虑到上述因素,目标之间的内在张力的完整性及其保持抽象为期刊编辑设定的空间限制经常被认为是一个重大的挑战。

介绍

项目3:基本原理。

的上下文中描述的基本原理回顾已知。

的例子。“扭转的趋势增加体重对身高儿童被证明是困难的。人们普遍认为增加能量消耗和减少能量摄入形式管理的理论基础。因此,干预旨在增加体育锻炼和改善饮食的基础努力预防和治疗儿童肥胖。这种生活方式干预已经被最近的系统评价,支持以及加拿大儿科协会、皇家儿科和儿童健康学院,美国儿科学会。然而,这些干预措施充满了可怜的依从性。因此,以学校为基础的干预措施理论上是有吸引力的,因为与干预可以提高依从性。因此,许多地方政府已经制定或正在考虑强制增加身体活动在学校的政策,尽管这类干预措施对身体成分的影响尚未评估。”[33]

解释。

读者需要了解背后的基本原理研究,系统回顾可能添加到已知的内容。作者应该告诉读者是否他们的报告是一个新的系统评审或更新现有的一个。如果评审是一个更新,作者应该状态更新的原因,包括已添加到以前版本以来的证据基础的复习。

一个理想的背景或介绍,为读者可能包括以下设置上下文。首先,作者可能定义审查的重要性问题从不同的角度(例如,公共卫生,个别患者或健康政策)。其次,作者可能简要提及知识的当前状态和其局限性。在上面的例子中,几种不同干预措施的影响的信息可以帮助读者理解潜在的相对利益或损害特定干预措施需要审查。第三,作者可能会激起读者的胃口通过清晰地阐明回顾旨在增加。他们也可能讨论的程度的局限性可能克服现有的证据基础。

第四项:目标。

提供一个明确的声明的问题被解决,参照参与者,干预措施,比较,结果,研究设计(海岸边)。

的例子。“检查是否局部管腔内的抗生素减少导管相关血流感染,我们回顾了随机对照试验,评估这些抗生素的疗效为初级预防与导管相关血流感染和死亡率相比没有抗生素成年人接受血液透析治疗。”[34]

解释。

问题被解决的基本原理,是一个系统回顾的最关键部分。他们应该陈述准确和明确,以便读者能理解快速审查的范围和潜在的适用性评估他们的利益[35]。框架的问题,包括以下五个“海岸边”组件可以提高复习的明确性问题:(1)的患者人群或疾病(P),(2)感兴趣的干预或接触(我),(3)比较器(C),(4)感兴趣的主要结果或端点(O)和(5)研究设计选择。更多细节关于海岸边,明白了框2

好可以勉强集中或广泛的审查问题,根据总体目标的审查。有时问题可能会增加结果的适用性和促进检测偏差,探索性分析和敏感性分析[35],[36]。是否在很小范围广泛,恰恰说明评估的目标是至关重要的,因为他们帮助定义审查过程的其他组件,如合格标准(6)项和搜索相关文献(7和8)项目。

方法

项目5:协议和登记。

表明如果一个审查协议存在,如果它可以访问(例如,Web地址),如果可行的话,提供注册信息包括注册号码。

的例子。”方法的分析和入选标准预先指定并记录在一个协议。”[37]

解释。

一个协议很重要,因为它pre-specifies系统评价的目标和方法。例如,协议指定感兴趣的结果,评论家将如何提取信息这些结果,评论者可能使用的方法定量总结结果数据(见项目13)。有一个协议可以帮助限制偏差的可能性事后决策评估方法,如选择性报告结果。提供关于元素指导几个来源包括协议的系统回顾[16],[38],[39]。个别患者的立场的荟萃分析数据,我们建议作者描述设计协议是否明确,是否,何时,如何参与合作支持[40],[41]

在研究作者可能修改协议,读者不应该自动考虑这样修改不合适的。例如,合法的修改可能扩展搜索到包含旧或新的研究,拓宽合格标准,证明太窄,或添加分析如果主分析表明,额外的保证。然而,作者应该描述的修改和解释他们的理由。

虽然值得协议修正案很常见,一个必须考虑的影响协议的修改可能在系统回顾的结果,特别是主要的结果是改变了。选择性报告结果的偏差的随机试验已经被很好地记录下来了[42],[43]。考试的47 Cochrane综述揭示间接证据可能选择性偏差对系统评价报告。几乎所有的(n= 43)包含一个主要的变化,如增加或删除的结果之间的协议和完整的出版物[44]。(或程度)是否反映出改变偏见,但是,还不清楚。例如,它已经相当常见的不是描述结果,没有提出任何包括研究。

注册一个系统回顾,通常与一个协议和注册号码,还不常见,但有些机会存在[45],[46]。注册可能降低多个评论的风险解决同样的问题[45],[46],[47],[48],减少发表偏倚,更新系统评价时提供更大的透明度。值得注意的是,MEDLINE收录的系统评价的一项调查发现,2004年11月的报告协议使用增加了约46%[3]从8%提到在以前的调查[49]。的改善主要是由于Cochrane综述,通过要求,出版协议[3]

项目6:合格标准。

指定研究特征(例如,海岸边,后续的长度)和报告的特点(例如,年认为,语言,出版状态)作为标准资格,给予理由。

的例子。类型的研究:“随机临床试验研究乙肝疫苗的政府CRF(慢性肾功能衰竭)患者,有或没有透析。没有语言,出版日期,或发布状态的限令…”

类型的参与者:“任何年龄的参与者与CRF或接受透析(血液透析或腹膜透析)被认为是。CRF被定义为血清肌酐大于200µmol / L一段超过六个月或个人接受透析(血液透析或腹膜透析)…肾移植患者被排除综述随着这些个体的免疫抑制和正在接受免疫抑制剂药物防止器官移植排斥的,他们基本正常肾功能…”

类型的干预:“试验比较有益和有害的影响乙肝疫苗佐剂或细胞因子co-interventions[和]试验比较免疫球蛋白预防的有益和有害的影响。本文仅限于研究活跃的免疫接种。(等离子体或重组乙型肝炎疫苗(酵母)派生)的类型、剂量,治疗和安慰剂,控制疫苗,或没有疫苗…”

类型的结果的措施:“主要结果措施:血清转化,即足够的患者比例anti-HBs响应(> 10 IU / L或样本比例单位)。乙肝感染(以乙型肝炎核心抗原(HBcAg)积极性或持久HBsAg阳性),急性和慢性。急性(初级)乙肝病毒(乙型肝炎病毒)感染被定义为IgM anti-HBc血清转化HBsAg阳性或发展。慢性乙肝病毒感染被定义为持久性的HBsAg超过六个月或HBsAg积极性和肝脏活检兼容或慢性B型肝炎辅助诊断结果措施:不良事件的乙肝疫苗…[和]…死亡率。”[50]

解释。

合格标准是至关重要的知识评价的有效性,适用性,全面性的回顾。因此,作者应该明确地指定合格标准用于审查。仔细定义的合格标准通知各个步骤的评估方法。他们影响搜索的发展战略选择和服务,以确保研究的系统性和公正的方式。

可能描述的多个研究报告,和一个可以描述多个研究报告。因此,我们独立的合格标准为以下两个部分:研究特点和报告的特点。都需要报告。研究合格标准可能包括人群,干预措施,比较器、感兴趣的结果,并研究设计(海岸边;看到框2),以及其他一些具体的元素,比如指定后续的最小长度。作者应该国家研究是否会被排除在外,因为他们不包括(或报告)特定的结果,帮助读者确定系统回顾可能偏见由于选择性报告[42],[43]

报告合格标准可能包括语言出版,出版状态(例如,包括未发表的材料和摘要),和出版年份。不包含或非英语语言文学[51],[52],[53],[54],[55]未发表的数据,以上数据可以影响效应估计的荟萃分析[56],[57],[58],[59]。可能需要注意包括所有确定的研究由于潜在的偏见等不同的风险,例如,选择性报告摘要[60],[61],[62]

项目7:信息来源。

描述搜索所有信息来源(例如,数据库和日期范围,接触研究的作者识别额外的研究)和日期最后一次搜索。

的例子。“研究发现通过搜索数据库,电子扫描参考文章列表和与该领域的专家和制药公司磋商…没有限制申请语言和外国论文翻译。这个搜索应用于Medline(1966年至今),CancerLit(1975年至今),和用于Embase(1980年至今),科学引文索引扩展(1981 -现在)和Pre-Medline电子数据库。科克伦和敢(数据库抽象的评论的有效性)综述了数据库…最后搜索是运行在2001年6月19日。此外,我们handsearched内容页的临床肿瘤学杂志》2001年,欧洲癌症杂志》2001年和2001年骨,加上抽象印花在这些期刊1999 - 2001。有限的更新进行文献检索从2001年6月19日到2003年12月31日。”[63]

解释。

国家医学图书馆的MEDLINE数据库是一个世界上最全面的医疗信息的来源。但是,就像任何数据库,覆盖不完整,根据领域不同。从任何单一数据库检索,即使是一位经验丰富的搜索器,可能是不完美的,这就是为什么在系统回顾详细的报告是非常重要的。

至少,对于每一个数据库搜索,作者应该报告数据库,平台,或提供者(例如,奥维德,对话框,PubMed)的开始和结束日期每个数据库的搜索。这个信息让读者评估审查的货币,这是很重要的,因为出版时间间隔使废弃一些评审的结果[64]。这些信息也应该提高更新效率[65]。作者还应该报告开发并进行搜索[66]

除了搜索数据库,作者应该报告的使用辅助识别方法的研究,如手搜索期刊,检查引用列表,搜索试验注册或监管机构网站[67],联系制造商,或联系作者。作者也应报告如果他们试图获得任何缺失的信息(例如,研究方法或结果)的调查人员或赞助商;是有用的简述联系谁,未发表的信息。

第八项:搜索。

现在至少有一个主要的完整电子搜索策略数据库,包括任何限制使用,这样它可以被重复。

的例子。在文本:“我们使用以下搜索条件搜索所有试验记录和数据库:免疫球蛋白*;丙种球蛋白;脓毒症;脓毒性休克;败血症的;和败血症…”[68]

在附录:“搜索策略:MEDLINE(奥维德)

01。免疫球蛋白/

02。免疫球蛋白.tw美元。

03。ivig.tw。

04。1或2或3

05。脓毒症/

06。sepsis.tw。

07年。脓毒性休克/

08年。败血性shock.tw。

09年。败血症/

10。septicaemia.tw。

11。septicemia.tw。

12。5或6或7或8或9或10或11

13。4和12

14。随机对照试验/

15。randomized-controlled-trial.pt。

16。controlled-clinical-trial.pt。

17所示。随机分配/

18岁。双盲方法/

19所示。单盲方法/

20.14或15或16或17或18或19

21。临床试验经验/

22。clinical-trial.pt。

23。(中国的审判)美元.ti, ab。

24。((singl或房子或trebl美元或美元tripl $)的(盲人)美元).ti, ab。

25。安慰剂/

26岁。安慰剂.ti美元,ab。

27。随机.ti美元,ab。

28。21或22或23或24或25或26或27

29。研究设计/

30.比较研究/

31日。实验评价研究/

32。后续研究/

33。前瞻性研究/

34。(控制或潜在或志愿者)美元美元.ti, ab。

35。30或31、32或33或34

36。20 - 28或29或35

37岁。13 - 36”[68]

解释。

搜索策略是报告的一个重要组成部分的任何系统性回顾。搜索可能是复杂和迭代,特别是当评论家搜索不熟悉数据库或他们的评论是解决广泛的或新的话题。浏览搜索策略有兴趣的读者可以评估搜索的全面性和完整性,并复制它。因此,我们建议作者报告他们的完整电子搜索策略,至少有一个主要的数据库。替代呈现所有数据库的搜索策略,作者可能表明如何搜索考虑其他数据库搜索、索引词不同的数据库。如果不同搜索用于不同部分的一个更广泛的问题(例如,相关问题的好处和危害的相关问题),我们建议作者至少提供一个策略的一个例子为每个目标的一部分[69]。我们也鼓励作者状态搜索策略是否同行评议系统评价过程的一部分[70]

我们意识到杂志上也不尽相同,在报告的文本搜索策略并不总是可行的。然而,我们强烈鼓励所有期刊上想办法,比如Web额外的附录,或电子存档链接,搜索策略的读者。我们也建议所有作者存档他们的搜索,这样(1)其他人可能访问和检查它们(例如,复制或理解为什么他们评论类似的话题没有确定相同的报告),和(2)未来的更新他们的评论了。

几个来源提供指导开发搜索策略[71],[72],[73]。大多数搜索限制,例如有关时间和财力有限,无法访问或不足索引报告和数据库,不可用的专家与特定语言或数据库搜索技能,或审查问题相关的证据并不容易找到。作者应该直接在描述他们的搜索约束。除了关键字用来确定或排除记录,他们应该报告相关搜索任何额外的限制,比如语言和日期限制(参见资格标准,项目6)[51]

项目9:研究选择。

选择研究过程(即状态。,for screening, for determining eligibility, for inclusion in the systematic review, and, if applicable, for inclusion in the meta-analysis).

的例子。“资格评估…[是]执行独立选取标准化地2评论家…评论者之间的分歧是通过共识来解决。”[74]

解释。

没有标准选择研究过程包括在系统回顾。作者通常开始大量的识别记录的顺序搜索和排除记录根据合格标准。我们建议作者报告如何筛选检索记录(通常是一个标题和摘要),经常有必要回顾全文发表,如果任何类型的记录(例如,写信给编辑)被排除在外。我们还建议使用棱镜流程图总结研究选择流程(见17项;盒3)。

盒3。识别的研究报告和数据提取

综合搜索通常导致大量的识别记录,数量小得多的研究包括在系统回顾,和更少的这些研究包括荟萃分析。系统评价的报道经常提供小细节的方法在这个过程中由评审小组。读者往往剩下什么可以被描述为“x档案”的现象,因为它是不清楚发生在初始确认记录和最后审查中。

有时,审查报告只是作者的数量包括研究;通常他们报告的初始数量确认记录,包括研究的数量。很少,虽然这是读者最优,做评论作者报告确认记录的数量,数量小的潜在的相关研究,包括研究的更小的数量,结果。评论作者还需要区分和研究报告的数量。通常不会出现1∶1比例的报告中描述的研究和信息需要系统综述报告。

理想情况下,识别研究报告应报告为文本结合使用棱镜流程图。虽然我们建议使用流程图,少量的评论可能是特别简单,可以充分描述文本的一些简短的句子。更普遍的是,审查报告需要作者每一步的过程:检查确认记录;检查潜在的相关研究的全文(和报告无法获得);和应用包括合格标准选择研究。

这样也应该详细描述如何可能符合条件的记录被提升为下一阶段的审查(例如,全文筛选),这一过程的最后阶段,包括研究。经常回顾团队有三个回答选项排除记录或促进他们的下一个阶段风选过程:“是的,”“不,”和“也许”。

同样,一些细节应该参与报道,这些过程是如何完成的。例如,一个人可能屏幕识别记录,而一个人独立检查的小样本。整个筛选过程是“好内务”之一,有兴趣的读者应该能够从工作包括研究提出相同的数量的确认记录。

通常会有缺乏信息描述数据提取流程在系统评价的报道。作者可能只是报告,“相关”数据提取从每个包括研究很少用于数据提取信息的过程。它可能是有用的为读者知道系统综述的作者,先天的,数据提取形式,是否使用,多种形式的数量问题,形式是否试点测试,完成了提取。例如,重要的是让读者知道一个或更多的人提取的数据,如果是这样的话,这是否独立完成,是否“共识”中使用的数据分析,如果审查小组完成了一个非正式的培训锻炼或更正式的可靠性。

努力增强客观性,避免错误研究选择是重要的。因此作者应该报告是否每个阶段是由一个或几个人,这些人是谁,当多个独立调查人员进行选择,什么过程来解决分歧。使用至少两个调查员可能减少拒绝的可能性有关报道[75]。好处可能是最大的主题,选择或拒绝一篇文章需要艰难的判断[76]。这些主题,作者应该告诉读者的两分的协议,一般仲裁如何选择是必需的,和什么是努力解决分歧(例如,通过接触原始研究)的作者。

项10:数据收集过程。

从报告描述数据提取的方法(例如,驾驶的形式,由两个独立评论员)和任何过程从调查人员获取和确认数据。

的例子。“我们开发了一个数据提取表(基于Cochrane消费者和通信审查小组的数据提取模板),测试包括10个随机选择的研究,并因此精制。一个评论的作者提取以下数据包括研究和第二作者检查提取的数据…有分歧的解决两个评论作者之间的讨论;如果可以达成任何协议,这是第三个作者将决定计划。我们联系了五个作者对进一步的信息。所有反应和提供一个数值数据,只有发表论文中以图形的方式了。”[77]

解释。

评论家从每个提取信息包括研究,这样他们可以批判,现在,在系统回顾和总结证据。他们也可能接触的作者包括研究没有的信息,或者约定,报道。在个别病人数据的荟萃分析,这一阶段包括详细的原始数据库的收集和审查。作者应该描述这些方法,包括任何措施来减少偏见和错误在数据收集和数据提取[78](盒3)。

一些系统的评论者使用数据提取表单,可以报道作为附录或“Web额外”报告。这些表格可以显示读者评论家寻求什么信息(见11项)以及他们如何提取它。作者告诉读者如果表单是驾驶。无论如何,我们建议作者告诉读者提取数据,是否拔牙是在复制完成,,如果是这样,是否重复抽象独立完成和分歧是如何解决的。

发表的报告包括研究可能无法提供评审所需的所有信息。评论者应该描述任何行动他们寻求额外的信息从原始研究人员(见项目7)。描述可能包括他们如何试图联系人员,他们要求,他们成功地获得必要的信息。作者还应该告诉读者当个体患者数据寻求从原来的人员[41](见项目11)和显示这些数据的研究中使用的分析。评论家理想也应该状态是否确认信息的准确性包括在他们的审查与原来的研究人员,例如,通过送一份草案的审查[79]

一些研究已不止一次。复制出版物可能很难确定,他们的包容可能引入的偏见[80],[81]。我们建议他们使用作者描述任何步骤避免重复计算和拼凑数据从多个报告相同的研究(例如,对比了作者的名字,治疗比较,样本大小,或结果)。我们也建议作者表明是否所有报告的一项研究认为,矛盾可能揭示重要的局限性。例如,多个出版物的审查报告的药物试验表明,研究特征可能不同于报告报告,包括设计的描述,数量的病人进行了分析,选择了显著性水平,和结果[82]。作者理想情况下应该提供任何算法,用于选择重叠的数据报告和任何努力来解决跨报表的逻辑矛盾。

11项:数据项。

列表和定义变量的数据都是寻求(例如,海岸边,资金来源),以及任何假设和简化。

的例子。“信息提取从每个试验包括:(1)试验参与者的特征(包括年龄、舞台和疾病严重程度,方法诊断),和审判的纳入和排除标准;(2)类型的干预(包括类型、剂量、持续时间和频率的非甾体抗炎药(非甾体抗炎药);与安慰剂或与类型、剂量、持续时间和频率的另一种非甾体抗炎药;或与另一个疼痛管理药品;或于不采取任何治疗措施);(3)类型的测量结果(包括减少疼痛的水平,改善生活质量评分(使用验证范围内),影响日常活动,缺席或学校工作,跟进的长度,意想不到的治疗效果,许多女性需要更多侵入性治疗)。”[83]

解释。

是很重要的读者知道什么信息审查作者寻求,即使其中一些信息是不可用的[84]。如果审查仅限于报告只获得这些变量,而不是那些被认为重要,但不能获得,偏见可能会引入和读者可能误导。因此帮助如果作者可以参考读者协议(见第五项),和档案提取形式(见项目10),包括变量的定义。发布的系统评价应该包括过程的描述,如果相关,规范的读者可以获得额外的材料。

我们鼓励作者报告是否在评审开始加入了一些变量。这些变量可能包括那些在研究中发现,评论者识别(例如,重要措施,结果评论家最初被忽略)。作者应该描述的原因任何变量添加到那些已经预先确定的协议,以便读者能理解评审过程。

我们建议作者报告任何假设他们缺失或不清楚信息和解释这些过程。例如,在50岁以上女性的研究是合理的假设没有怀孕,即使这不是报道。同样,评论作者可能对药物的给药途径做出假设评估。然而,应特别注意对定性信息进行假设。例如,较高的年龄限制为了减少“孩子”可以从15年21年有所不同,“激烈”理疗可能意味着不同的事情不同的研究者在不同的时间和不同的病人,以及与“重”相关的血液量根据设置失血可能相差很大。

项目12:个人偏见的风险研究。

描述方法用于风险评估个人偏见的研究(包括规范是否这样做是在学习或结果层面,或者两者兼而有之),以及这些信息如何被用于任何数据合成。

的例子。“确定符合条件的随机试验的有效性,对评论者独立工作和足够的可靠性决定了随机化的充分性和隐蔽的分配、致盲的患者,卫生保健提供者,数据收集器,和结果评估;和追踪损失的严重程度(即比例的患者的调查人员无法确定结果)。”[85]

“探索变化研究结果(异质性)之前我们指定以下假设进行分析。我们提出,效果可能不同的方法学质量的研究。”[86]

解释。

治疗效果的可能性在系统回顾报告接近真相取决于包括研究的有效性,在一定的方法论特征可能与尺度效应有关[87],[88]。例如,试验没有足够的报道平均分配隐藏夸大治疗效果相比,那些有足够的隐蔽[88]。因此,重要的是作者描述任何方法,他们用来衡量偏差的风险188bet手机版188bet手机版包括研究和信息技术是如何被使用的[89]。此外,作者应该提供一个基础,如果没有偏见进行的风险评估。最流行的术语来描述与此项目相关的问题是“质量”,但原因,阐述了4盒我们喜欢这种产品名称为“风险评估偏见。”

箱4。研究质量和风险的偏见

在本文中,和其他地方[11],我们试图用一个新的术语对许多读者来说,即偏差的风险,评估每一个包括在系统回顾研究。以前的论文[89],[188]倾向于使用术语“质量”。当进行系统回顾我们认为重要的是要区分质量和偏见和关注的风险评估和报告。质量通常是最好的作者已经能够做的。例如,作者可能报告手术试验的结果,炫目的评估结果不属于审判的行为。尽管这可能是最好的方法研究人员能够做的,还有理论理由相信这项研究是容易(风险)的偏见。

评估偏差的风险应该实施和报告的一部分,任何系统的审查。在所有情况下,我们鼓励系统的评论者之前仔细思考偏见的风险(方法学和临床)可能会影响他们的系统评价的结果。

系统的评论者,理解偏差的风险研究的结果往往是困难的,因为该报告只是一个代理的实际进行研究。有一些建议[189],[190]报告可能不是一个合理的研究的传真,尽管并非所有人都持这种观点[88],[191]。有三种主要的方式来评估风险的偏见:单个组件,检查列表,和鳞片。有许多鳞片[192],虽然我们谨慎使用的理论依据[193]和新兴的经验证据[194]。清单不太常用的和潜在的运行相同的问题。我们提倡使用一个组件的方法和基于领域有良好的经验证据和可能强烈的临床依据。新Cochrane偏见的风险工具[11]就是这样一个组件的方法。

Cochrane偏见的风险工具包括五个项目的经验证据的偏压影响干预的有效性的估计的随机试验(序列生成、分配隐藏、炫目,不完整的结果数据,和选择性的结果报告)和全方位项目称为“其它来源的偏见”[11]。也有一些共识,这些项目可以申请评估的研究非常多样化的临床领域[93]。其他偏见的风险项目可能主题甚至研究特定,即。,they may stem from some peculiarity of the research topic or some special feature of the design of a specific study. These peculiarities need to be investigated on a case-by-case basis, based on clinical and methodological acumen, and there can be no general recipe. In all situations, systematic reviewers need to think ahead carefully about what aspects of study quality may have a bearing on the results.

许多方法存在偏见的整体风险评估包括研究,包括尺度、清单、和各个组件[90],[91]。讨论了在4盒多个组件,尺度数值总结到一个数字是误导和无益的[92],[93]。相反,作者应该指定他们评估方法论的组件。常见的随机试验的有效性包括以下标记:适当的一代的随机分配序列[94];隐藏的分配顺序[93];炫目的参与者,卫生保健提供者,数据收集器,结果退休审核人员[95],[96],[97],[98];比例的患者失访[99],[100];停止试验早期的好处[101];以及是否遵循意向处理分析原则[100],[102]。最终决定,方法论的特性来评估需要考虑强度的经验数据,理论基本原理,包括特殊环境下的研究。

作者应该如何评估风险报告的偏见;是否以盲目的方式;如果评估完成的不止一个人,如果是这样,他们是否独立完成[103],[104]。同样,我们鼓励作者报告任何校准完成演习评估团队成员之间。最后,作者需要报告的评估偏差的风险是如何使用随后在数据合成(见16项)。尽管常常困难的任务评估偏差的风险包括研究,作者有时沉默与结果评估他们所做的[89]。如果作者排除研究的回顾或任何后续分析的基础上,偏见的风险,他们应该告诉读者研究排除并解释原因除外责任(见第6项)。作者还应该描述任何计划相关敏感性或子群分析偏差评估(见16项)。

项目13:总结措施。

国家主要总结措施(例如,风险比,均数差)。

的例子。“相对死亡率降低风险的主要措施是治疗效果。”[105]

“执行的荟萃分析是计算相对风险(RRs)使用随机模型。在意向性治疗基础上对定量分析和仅限于数据来源于后续的时期。RR和95%置信区间为每个副作用(以及所有副作用)计算了。”[106]

“主要结果测量指标是平均差在日志中10hiv - 1病毒载量比较补锌安慰剂…”[107]

解释。

规划系统回顾时,它通常是可取的,作者pre-specify主要关心的结果(见第五项)以及预期效果总结为每个结果测量。选择摘要效应测量可能不同于用于包括的一些研究。如果可能应解释影响措施的选择,尽管它并不总是很容易提前判断衡量是最合适的。

二进制的结果,最常见的总结措施的风险比,优势比,和风险不同[108]。相对影响比绝对一致的研究效果[109],[110],虽然绝对差异很重要当解释结果(见24项)。

连续的结果,自然效果测量是不同的[108]。在所有研究结果时使用适当的测量是由相同的规模。使用标准化的差异意味着当研究不产生直接可比数据。这通常发生在所有研究评估相同的结果,但测量它以多种方式(如抑郁症不同尺度来衡量)。

比较的结果,风险比是最常见的总结。评论家需要日志风险比及其标准误被包括在一个荟萃分析研究[111]。这些信息可能不是给所有的研究,但方法可用于估算所需的数量从其他报告信息[111]。风险率和比值比(相对于事件发生在一个固定的时间)不等同于风险比,和平均生存时间并不是一个可靠的荟萃分析的基础[112]。如果作者使用这些措施应该在报告中描述他们的方法。

14:项目计划的分析方法。

描述的方法处理数据,结合研究的结果,如果完成,包括一致性(例如,我的措施2为每一个荟萃分析)。

的例子。“我们测试的异质性Breslow-Day测试,并使用希金斯等人提出的方法测量不一致(总变异的百分比在研究由于异质性)在降脂干预措施的效果。这种程度的不一致(称为我的优点2本质上),它不依赖于许多研究,伴随着不确定性区间。”[113]

“在很少情况下,估计基线的意思或生命质量(生活质量)反应得到没有相应的估计方差(标准差(SD)或标准错误)。在这些情况下,SD从已知的均值SDs估算。在许多情况下,响应数据的均值和方差在以前研究条件和治疗。within-patient方差在这些情况下不能直接计算,近似假设的独立。”[114]

解释。

从研究中提取的数据审查可能需要一些转换(处理)之前适合分析或对证据表示在一个表中。尽管这些数据处理可以促进荟萃分析,有时需要即使荟萃分析还没有完成。例如,在试验中有超过两个干预组可能需要结合结果为两个或两个以上的团体(例如,接受相似但不同的干预),或者它可能是可取的,只包含数据的一个子集匹配审查的入选标准。当几个不同尺度(如抑郁症)在研究中,使用一些分数的迹象可能需要逆转,以确保所有尺度是一致的(例如,如此之低的值代表身体健康在所有尺度)。标准差可能不得不重建等统计数据p值和t统计数据[115],[116]偶尔,或者他们可能估算标准偏差在其他研究中观察到[117]。比较数据也通常需要谨慎转换为一致的格式[111]。作者应该报告任何这样的数据处理的细节。

统计数据的组合两个或两个以上的独立研究分析可能是既无必要,也可取(见框5和项目21)。无论决定结合个人的研究结果,作者应该报告他们计划如何评价之间的可变性(异构性或不一致)(箱6)。在试验结果的一致性可能影响的决定是否结合在一个荟萃分析试验结果。

5箱。是否合并数据

决定是否将数据包括统计、临床和方法学方面的考虑。统计决策可能是最技术和以证据为基础的。这些都是更彻底地讨论箱6。临床和方法论的决策一般基于审查小组内讨论和可能更主观。

临床考虑将受到审查试图解决的问题。广泛的问题可能会提供更多的“许可证”将更多的不同的研究,如“利他林是否有效地提高集中注意力在人们诊断出患有注意缺陷多动障碍(ADHD)。“这里作者可能选择结合涉及儿童和成人的研究报告。如果临床问题是更有针对性,比如是否“利他林是有效提高课堂注意力在以前未确诊的ADHD儿童没有并存状况,“很可能不同的决定关于合成是由作者的研究。在任何情况下作者应该描述他们的临床决策系统综述报告。

决定是否将数据还有一个方法论的组件。评论者可能决定不结合研究的低风险偏差与高风险的偏差(见项目12和19)。例如,对于主观结果,系统综述的作者可能不希望结合评估,在盲目的情况下,那些没有完成。

任何特定的问题可能没有一个“正确”或“错误”的选择关于合成,这样的决定可能是复杂的。然而,随着选择可能是主观的,作者应该透明的关键决策并为读者描述它们。

箱6。分析和评估的一致性(异质性)

荟萃分析:统计结合多个研究的结果

如果是觉得应该研究他们的结果统计相结合,必须考虑其他问题,因为有很多方法进行荟萃分析。不同的影响措施可用于二进制和连续的结果(参见条目13)。同样,有两种常用的统计模型结合数据的荟萃分析[195]。那里的固定效应模型假定所有纳入研究的特征是一种常见的治疗效果[196];假定观察到的差异在研究结果反映随机变化[196]。随机模型假定没有常见的治疗效果,而是包括所有研究的差异影响跨研究遵循一个特定的分布[197]。在随机模型相信包括研究表示随机样本从一个更大的人口研究解决问题的兴趣[198]

没有共识是否使用固定或随机影响模型,并都在广泛使用。下面的差异影响了它们之间的一些研究人员对他们的选择。随机模型给小试验的结果更多的重量比固定效应分析,这可能是不受欢迎的小型试验可能不如和最容易发表偏倚。固定效应模型只考虑within-study变化而随机影响模型考虑内部和之间的差异性。这就是为什么一个固定效应分析往往给窄的置信区间(即。比随机分析,提供更大的精度)[110],[196],[199]。在没有任何学术研究的异质性,固定和随机估计一致。

此外,还有不同的方法来执行这两种类型的荟萃分析[200]。常见的固定效应方法是Mantel-Haenszel和逆方差,而随机分析通常使用DerSimonian和Laird的方法,尽管存在其他方法,包括贝叶斯荟萃分析[201]

存在明显的之间的异质性(见下文),有些人认为,使用固定效应分析是违反直觉的,因为他们的主要假设是违反了。另一些人认为它是不进行任何分析试验结果当有不明原因的可变性。如果评审人员决定不把数据定量,危险在于,最终他们可能使用quasi-quantitative可怜的有效性规则(例如,投票数有多少研究名义上重要的结果)解释的证据。结合数据统计方法存在任何可能出现的复杂情况在系统回顾,但是必须意识到自己的假设和限制,以避免误用或曲解这些方法。

评估的一致性(异质性)

我们希望一些变异(不一致)在不同研究的结果由于单独的机会。变化的,由于机会反映真实试验结果的差异,并被称为“异质性。“传统的统计方法评估异质性是卡方测试(科克伦的问),但它有低功率时很少有研究和过度的权力有许多研究[202]。相比之下,我2统计量化的变化量超出预期的结果在研究机会,所以比Q[202],[203]。我2代表总数的百分比变化效应在研究估计,由于非均质性,而不是机会;一些作者考虑一个我2值小于低25%[202]。然而,我2也遭受巨大的不确定性常见的情况,但只有很少的研究是可用的[204],我和报告中的不确定性2(例如,95%置信区间)可能是有帮助的[145]。当有一些研究,推断异质性应该谨慎。

观察到相当大的异质性时,建议考虑可能的原因[205]。特别是,异质性可能是由于子组之间的差异的研究(见16项)。同时,数据提取错误的常见原因异质性在结果与连续的结果[139]

荟萃分析完成时,作者应该指定效应测量(例如,相对风险或平均差)(见13项),统计方法(例如,逆方差),以及是否固定或随机的方法,或其他方法(如贝叶斯)(见使用箱6)。如果可能的话,作者应该解释这些选择的原因。

在研究项15:偏见的风险。

指定任何风险评估的偏差可能影响累积证据(如发表偏倚,选择性报告研究)。

的例子。“为每个审判我们绘制的逆效应的标准误差。对称的漏斗图的视觉评估,并正式症的测试,看看效果随样本容量增加而降低。”[118]

“我们评估发表偏倚的可能性,通过评估一个漏斗阴谋审判意味着不同的不对称,从而导致非出版物的小型试验结果…因为图形可以主观的评价,我们也进行了一次调整等级相关测试和回归测试不对称作为正式的统计检验发表偏倚…我们承认,其他因素,如不同的审判质量和真正研究异质性,可能产生不对称的漏斗图。”[119]

解释。

评论者应该探索可用的数据是有偏见的可能性。他们可能检查的结果可用的研究线索表明可能有缺失的研究(发表偏倚)或丢失的数据包括研究(选择性报告偏见)(见7箱)。作者应该详细报告任何方法在研究调查可能的偏见。

箱7。偏见引起的选择性出版的研究在研究或结果

系统评价的目标是将所有相关的信息的研究。从一些研究缺乏信息可能构成严重威胁评估的有效性。的数据可能是不完整的,因为一些研究没有发表,或因为不完整或不报告发表的一篇文章。这些问题通常被概括为“发表偏倚”尽管事实上充分研究和选择性的偏见起源于干脆不出版的结果与他们的发现。研究成果的干脆不依赖于实际结果偏差的风险是一个重要的系统回顾和荟萃分析。

缺失的研究

一些实证调查表明,临床试验的结果更有可能发表如果结果具有统计学意义(p如果他们不是比< 0.05)[125],[206],[207]。例如,500年肿瘤试验超过200名参与者的初步结果的美国临床肿瘤学会的一次会议上,81%p< 0.05发表在五年内全面相比,只有68%的人p> 0.05[208]

已发表的研究中,那些有统计上显著的结果比那些更早发表非重大的发现[209]。当这些原因,一些研究缺少可用的结果将偏向夸大干预的效果。

丢失的结局

在许多系统评价,只有一些合格的研究(通常是少数)可以包含在一个荟萃分析为一个特定的结果。一些研究结果可能不是测量或测量而不是报道。前者不会导致偏见,但后者。

证据积累的选择性报告偏见是普遍的和相当大的重要性[42],[43]。此外,对于一个给定的数据结果可能以多种方式进行分析和演示的影响结果的选择。在102年的一项研究的随机试验,比较试用协议发表的报告显示,平均38%的功效和50%安全每试验结果,分别是不能用于分析。统计上显著的结果有更大的几率被充分发表在出版物相比,非重要结果有效性(集中优势比2.4;95%置信区间1.4 - 4.0)和安全(4.7,1.8,12)数据。其他研究也有类似的发现[210],[211]

发现缺失的信息

失踪的研究也日益被从试验注册。失踪的证据,结果可能来自与研究协议,如果可用,或发表文章的仔细检查[11]。研究发表偏倚和选择性报告结果很难排除或从可用的验证结果,特别是在一些研究是可用的。

如果可用的数据也影响(或两者)的偏见,较小规模的研究将会展示出更大的干预的影响的估计。因此一种可能性是,调查影响大小和样本大小之间的关系(或者更确切地说,效果估计的精度)。图形化方法,特别是漏斗图[212]和分析方法(例如,测试)是经常使用[213],[214],[215],尽管他们的解释可以是有问题的[216],[217]。严格地说,这样的分析调查“小型研究偏见”;原因可能有很多小比更大的研究,系统地研究不同尺度效应的报告偏见只是其中一个[218]。几种不同的测试偏差也提出,除了测试小书房的偏见[215],[219],[220],但没有一个可以被认为是黄金标准。尽管证据表明,较小规模的研究估计效果比大公司可能会建议现有证据的可能性是有偏见的,这些数据是常见的误解[123]

很难评估within-study选择性报告是否存在于一个系统的复习。如果个体研究的协议可用,协议和发表报告的结果可以比较。即使在没有协议的情况下,结果中列出的方法部分可以与发表的报告结果[120]。在196年只有一半的试验报告描述的比较两种药物在关节炎都影响变量方法和结果部分相同[82]。在其他情况下,临床知识的地区可能表明,测量结果很可能即使没有报道。例如,在一个特定的疾病,如果两个相互联系的结果报告但另一个不是,然后一个人应该质疑后者被选择性地忽略[121],[122]

只有36%(76 212)的治疗系统的评论发表在2004年11月报道,发表偏倚的研究被认为是只有四分之一的打算进行一个正式的评估偏差[3]。24篇文章发表于2005年的60个荟萃分析中,正式的评估报告,大多数是基于少于10研究;大多数显示显著的异质性;和许多评论家误解的结果测试工作[123]。回顾抗抑郁药物的试验发现,只有发表试验的荟萃分析了影响估计平均超过32%时发送到所有试验药物机构进行了分析[67]

项16:额外的分析。

描述方法的分析(例如,敏感性或亚组分析,多元回归),如果做,表明预先确定。

的例子。“敏感性分析是预先确定的。治疗效果根据质量检查组件(隐蔽的治疗分配、致盲的患者和照顾者,盲法评估结果),他汀类药物的起始时间,和他汀类的类型。一个因果灵敏度分析进行了包括未发表的数据使用cerivastatin审判。”[124]

解释。

作者可能执行额外的分析来帮助理解他们的审查结果是否健壮,所有这些都应该报告。这些分析包括灵敏度分析、亚组分析和多元回归[125]

敏感性分析是用来研究的主要发现的程度影响系统评价的变化方法或从各自的研究使用的数据(例如,研究入选标准,结果偏差的风险评估)。子群分析地址是否总结影响变化与特定的(通常是临床)的特征包括研究或市场参与者。多元回归亚组分析的概念扩展到考试的定量研究特点的影响效应大小[126]。多元回归也允许作者研究的贡献不同的变量来研究结果的异质性。系统评价的读者应该意识到多元回归有很多限制,包括危险的深意的发现[127],[128]

即使数据有限,许多可以进行额外的分析。选择哪一种分析进行将取决于审查的目标。然而,这些分析不受可能产生误导的结果。重要的是告诉读者这些分析,是否他们的理由,这是预先确定的。

结果

项17:研究选择。

给数字研究筛选,评估资格,并包括在审查,原因与排除在每个阶段,理想的流程图。

的例子。在文本:

“总共有10个研究涉及13个试验确定列入审查。Medline的搜索,PsycInfo Cinahl数据库提供了总计584引用。调整后509年重复。其中,479年研究后被丢弃,因为回顾这些论文的摘要似乎显然不符合标准。三个额外的研究…被丢弃,因为没有全文的研究或论文不能真正地翻译成英文。剩下的27的全文引用是更详细地检查了。似乎不符合入选标准的22项研究描述。5研究…满足入选标准,包括在系统回顾。额外的五个研究…,符合入选标准的引用被检查,相关论文和寻找研究引用这些文件。没有未发表的相关研究得到。”[129]

看到流程图图2

缩略图
图2。例图:流程图研究选择的例子。

DDW,消化疾病周;UEGW,联合欧洲胃肠病学的一周。复制与许可[130]

https://doi.org/10.1371/journal.pmed.1000100.g002

解释。

作者应该报告,最好是流程图,记录的总数确定电子书目来源(包括专业数据库或注册表搜索),手动搜索各种来源的引用列表,引证指标,和专家。是有用的,如果作者描绘为读者所选文章的数量被确定的不同来源,这样他们可以看到,例如,大多数文章是否被确认通过电子书目来源或从引用或专家。文献识别主要从引用或专家可能倾向于引用或发表偏倚[131],[132]

流程图和文字应该描述清楚报告选择整个复习的过程。作者应该报告:独特的搜索记录标识;初步筛选后记录排除(如筛选标题和摘要);检索的详细评估报告;潜在的不合格报告可收回;检索报告,不符合入选标准和排除的主要原因;包括在审查和研究。事实上,最合适的布局为不同的评论可能会有所不同。

作者还应该注意复制的存在或补充报告的数量,以便读者理解个人研究报告的数量相比,包括在审查中。作者应该使用一致的术语,如是否报道引用计数,记录,出版物,或研究。我们相信报告的研究是最重要的。

一个流程图可以非常有用;它应该描述的所有研究包括基于满足合格标准,是否数据统计分析结合在一起了。回顾87年的系统评价发现,大约一半包括QUOROM流程图[133]。这项研究的作者建议的一些重要方面,评论者可以提高使用流程图在描述信息的流动在评审过程中,包括一个单独的流程图为每个重要的结果报道[133]

项18:研究特点。

对于每一个研究,目前提取数据的特征(例如,研究大小,海岸边,随访期间),并提供引用。

的例子。在文本:

“包括研究的特征

方法

所有四个研究最终选择评审都是用英语发表的随机对照试验。期间RIO-North美国的干预是24个月和12个月RIO-Diabetes, RIO-Lipids和RIO-Europe研究。虽然最后两个描述一段24个月期间进行,只有第一个提供12个月的结果。所有试验试车,作为一个随机前盲目的时期。

参与者

包括研究涉及6625名参与者。主要的入选标准引起成年人(18岁以上),身体质量指数大于27公斤/米2,少于5公斤体重的变化在前三个月学习条目。

干预

所有试验都是男性。RIO-North美国是在美国和加拿大进行的,在欧洲和美国,RIO-Europe RIO-Diabetes在美国和其他10个不同国家,和RIO-Lipids八未指明的不同的国家。

干预是安慰剂,5毫克利莫那班或20毫克利莫那班每天一次除了轻微hypocaloric饮食(600千卡/天赤字)。

结果

在所有研究主要结果评估从基线体重变化经过一年的治疗和RIO-North美国研究还评估了第一和第二之间防止体重反弹。所有评价不利影响的研究,包括任何形式的和严重的事件。生活质量的测量在只有一个研究中,但是结果并没有描述(RIO-Europe)。

次要的和额外的结果

包括代谢综合征患病率一年后和改变代谢疾病风险因素如血压、血脂等。

没有研究包括死亡率和成本的结果。

结果测量的时间变量,包括月度调查,评估每三个月或一个最终评估后一年。”[134]

在表:看表2

缩略图
表2。示例表:包括研究的总结评估止吐剂剂在急性胃肠炎的功效。

https://doi.org/10.1371/journal.pmed.1000100.t002

解释。

为读者来评估系统的有效性和适用性评审的结果,他们需要了解包括研究。这些信息包括海岸边(框2)和特定信息相关的审查问题。例如,如果审查检查抗抑郁药物的长期影响中度抑郁症,作者应当包括后续时期的研究报告。对于每一个包括研究,作者应该提供一个引用来源的信息不管这项研究发表。这个信息让有兴趣的读者更容易检索相关的出版物或文档。

报告学习水平数据还允许的主要特征的比较研究,包括审查。作者应该提供足够的细节,让读者自行判断包括的相关性研究。这些信息也可以让读者进行自己的子群分析和解释子组,基于研究的特点。

作者应该避免,只要有可能,假设信息缺失时从一个研究报告(例如,样本大小,随机化的方法)。评论者可能接触原始调查人员试图获取信息缺失或确认的数据提取系统的审查。如果没有获得这些信息,应在报告中注明。如果估算信息,读者应被告知这是如何做的,哪些项目。展示学习水平数据可以清楚地识别未发表的信息从原始研究人员并使其可用于公共记录。

一般来说,学习水平特征作为一个表中的示例表2。这样表示确保所有相关的项目处理和信息缺失或不清楚注明。虽然纸质期刊一般不允许的数量信息在电子期刊或Cochrane综述,这不应被接受为借口的遗漏重要的方面包括研究的方法和结果,因为这些可以,如果有必要,在一个网站。

每个包含研究的表示和描述后,正如上面所讨论的,审查员通常提供一个叙事研究的总结。这样一个总结为读者提供包括研究的概况。可能发表论文的语言例如地址,年的出版物,包括和地理起源的研究。

海岸边框架通常是有用的在报道叙述总结表明,例如,参与者的临床特点和疾病严重程度和主要功能的干预和对照组。对于后备的干预措施,这可能有助于指定为每个研究干预的关键元素接收到每组。全部细节包括干预的研究被报道在只有三个25系统评价相关惯例[84]

在研究项目19:偏见的风险。

现在每个研究的数据偏差的风险,如果可用,任何产出水准评估(见项目12)。

的例子。看到表3

缩略图
表3。示例表:随机对照试验的质量措施未能履行任何一个六标记的有效性。

https://doi.org/10.1371/journal.pmed.1000100.t003

解释。

我们建议审稿人评估偏差的风险包括研究使用一个标准的方法定义的标准(见12项)。他们应该报告任何此类评估的结果[89]

报告只有汇总数据(例如,“两个八个试验充分隐藏分配”)是不够的,因为它未能告知读者研究的特定方法的缺点。一个更便捷的方式是显式地报告每个研究的方法论特征评估。Cochrane协作的新工具来评估偏差的风险也要求作者证实这些评估与任何相关文本从原始研究[11]。通常是最容易提供这些数据以表格格式,如例子。然而,叙述总结描述表格数据也可以对读者有用。

项20:个人研究的结果。

所有结果(好处和坏处),现在,对于每一个研究:(a)简单的汇总数据为每个干预组(b)效应估计和置信区间,理想情况下,一片森林。

的例子。看到表4图3

缩略图
图3。例图:总体失败(定义为分配方案的失败或复发)与tetracycline-rifampicin和tetracycline-streptomycin。

CI,置信区间。复制与许可[137]

https://doi.org/10.1371/journal.pmed.1000100.g003

缩略图
表4。示例表:在试验比较放疗和异位骨化的主要过程和髋骨骨折后非甾体抗炎药。

https://doi.org/10.1371/journal.pmed.1000100.t004

解释。

从个人发表总结数据研究分析可以复制和其他调查分析和图形显示。其他人可能希望评估的影响排除特定的研究或不考虑子群分析审查报告的作者。显示每个治疗组包括研究的结果还支持个人研究的检验特性。例如,如果只提供优势比,读者无法评估事件率的变化研究,使优势比无法解释[138]。此外,由于数据抽取在荟萃分析是常见的,可以大错误[139]从单个研究结果的报告更容易识别错误。连续的结果,读者可能希望检查一致性的标准偏差的研究,例如,放心,标准差和标准误没有困惑[138]

对于每一个研究中,每个干预组的汇总数据为二进制的结果通常是给定频率有和没有的事件(或等比例12/45)。它是不够的报告事件率每干预组百分比。所需的汇总数据连续结果均值,标准差,并为每组样本大小。在检查比较数据的回顾,作者应该报告日志风险比及其标准误为每个包括研究(或置信区间)。有时候,重要数据丢失的报告包括研究和不能从其他数据计算,但可能需要估算的评论家。例如,标准偏差可能估算使用典型的标准差在另一个试验[116],[117](见项目14)。只要有关,作者应该显示结果没有直接报道,必须从其他信息(见项目13)估计。此外,未发表的数据应该注意。

所有纳入研究的特征是很重要的礼物与置信区间估计的影响。该信息可能包含在一个表显示研究特征或森林图所示[140]。森林的关键元素情节效应估计和置信区间为每个研究显示图形,但最好也包括,为每一个研究中,数值类属特异性的汇总数据,影响的大小和置信区间,重量百分比(见第二个例子(图3])。讨论的结果的荟萃分析,看到项21。

原则上,所有上述信息应提供每一个审查结果认为,包括利益和损害。当有太多的结果包含的完整信息,结果最重要的结果应该包括在主报告和其他信息提供一个Web附录。信息呈现应该合理的选择根据原来规定的协议。作者应该明确提及如果计划中的主要结果不能提出由于缺乏信息。有证据表明,危害信息在系统评价很少报道,即使是在原来的研究[141]。危害结果的选择性遗漏偏差系统回顾并减少导致知情决策的能力。

21项:合成的结果。

目前的主要审查的结果。如果进行荟萃分析,包括为每个,置信区间和措施的一致性。

的例子。“死亡率数据对所有6个试验是可行的,为305名患者随机的311名患者和报告数据。没有死亡报告的三个呼吸道合胞体病毒/重症毛细支气管炎试验;因此我们的估计是基于三个试验随机的232名患者,其中64人死亡。在汇总分析,表面活性剂与死亡率显著降低(相对危险度= 0.7,95%置信区间-0.97 = 0.4,P = 0.04)。没有异质性(我的证据2= 0%)”。[142]

“因为研究设计,参与者,干预措施,并报告结果措施明显不同,我们专注于描述研究,他们的研究结果,其适用性,及其局限性和定性综合而不是荟萃分析”。[143]

“我们发现显著的异质性(我在这个比较2= 46.6%;χ2= 13.11,df = 7;P = 0.07)。回顾探索异质性的识别试验,似乎不同于其他人。它只包括小溃疡(伤口面积不到5厘米2)。排除这审判把统计学异质性,不影响任何证据的发现不同的凝胶之间的愈合率和简单的低附着敷料(相对危险度= 0.98,0.85到1.12(95%置信区间);我2= 0%)。”[144]

解释。

系统评价的结果应以有序的方式呈现。最初的叙述性描述的证据审查覆盖(见项目18)可以告诉读者研究人口和重要事情的设计和开展研究。这些描述可以方便的考试模式研究。他们也可能提供重要的信息适用性的证据,表明任何重大偏差的可能影响,并允许考虑,以一种系统化的方式,多种解释的可能结果的差异研究。

如果作者有一个或多个进行荟萃分析,他们应该现在估计效应在研究结果的置信区间。通常是最简单的显示每一个荟萃分析总结的实际结果,包括研究森林图(见20项)[140]。应该清楚的包括研究了每一个荟萃分析。作者还应该提供,对于每一个荟萃分析,测量结果的一致性的研究包括如我2(异构性;看到箱6);置信区间也可以给这个措施[145]。如果没有进行荟萃分析,定性推论应该尽可能系统地提出的一个解释为什么没有完成,荟萃分析在上面的第二个例子[143]。读者可能会发现森林的情节,没有总结估计,有用的在这种情况下。

报告一般应作者合成的结果测量他们着手调查(即。,这些描述的协议;见项目4)允许读者得出自己的结论的影响结果。读者应该意识到任何偏离计划分析。作者应该告诉读者,如果计划荟萃分析并不认为适当的或可能的结果,这一决定的原因。

这可能并不总是明智的给荟萃分析结果为每个结果和森林的阴谋。如果评审地址一个广泛的问题,可能会有大量的结果。同时,某些结果可能已报告在只有一个或两个研究中,在这种情况下,森林土地价值不大,可能严重的偏见。

MEDLINE收录的300系统评价2004年,一半多一点(54%)包括荟萃分析,其中绝大多数(91%)报告评估结果的不一致性。

22项:风险的偏见的研究。

存在任何偏见的风险评估研究的结果(见第15项)。

的例子。”异质性(我的强有力的证据2= 79%,P观察< 0.001)。探索这种异质性,漏斗的阴谋。漏斗图的图4显示了相当大的不对称的证据。”[146]

“具体来说,四舍曲林试验涉及486名参与者和一个西酞普兰试验274名参与者被报告为未能达到统计上显著的药物效果,没有报告意味着HRSD汉密尔顿抑郁量表评分。我们找不到数据从这些试验中制药公司网站或通过我们的搜索的文献发表。这些遗漏代表舍曲林试验中38%的患者和23%的患者在西酞普兰试验。分析有或没有包含这些试验没有发现差异模式的结果;同样,披露模式不与药物类型。使用数据获得FDA的目的是为了避免发表偏倚,包括未公开发表的试验。只包含那些舍曲林和西酞普兰试验了这意味着据报道,FDA将构成一种偏见报道类似于发表偏倚和为这些药物会导致高估drug-placebo差异类型。因此,我们目前只在数据分析完整的药物临床试验报道“变革”。[147]

缩略图
图4。例图:一个漏斗图显示的例子相当大的不对称的证据。

,标准误差。改编自[146]许可。

https://doi.org/10.1371/journal.pmed.1000100.g004

解释。

作者应该提供任何风险评估的结果偏差的研究。如果报告一个漏斗图,作者应该使用指定精确估计和测量的影响,提出了一般的x设在和y分别设在。作者应该描述如果和他们如何测试任何可能的不对称的统计意义(见第15项)。选择性报告结果的任何调查的结果在研究15项(如前所述)也应报告。同时,我们建议作者告诉读者如果任何预先确定偏差的风险评估研究分析未完成,原因(例如,包括研究太少)。

23项:额外的分析。

给额外的分析的结果,如果做的(例如,灵敏度或子群分析、多元回归(见项目16])。

的例子。“…软骨素的好处是小相比,试验与足够隐蔽的分配与试验不清楚隐藏互动(P = 0.050),与意向性治疗分析与试验,将患者排除在分析互动(P = 0.017),而在大型与小型试验互动(P = 0.022)。”[148]

“子群分析根据抗体状态,抗病毒药物,器官移植,治疗持续时间、使用抗淋巴细胞疗法,结果评估,研究质量和研究设计的其他方面没有展示任何治疗效果的差异。多元多元回归显示,巨细胞病毒无显著差异(巨细胞病毒)疾病后允许潜在的干扰或影响使用预防性药物,器官移植或收件人serostatus巨细胞病毒积极的接受者和巨细胞病毒巨细胞病毒的消极接受者积极捐赠。”[149]

解释。

作者应该报告任何子群或敏感性分析和是否预先确定(见项目5和16)。比较研究的亚组分析(例如,分离低收入和高剂量阿司匹林)的研究,作者应该报告任何测试交互,以及估计和置信区间从荟萃分析在每个子群。同样,多元回归结果(见16项)不应局限于p值,但应包括效应大小和置信区间[150],上面的第一个例子报道在表。包含在每个额外的数据量分析应该指定如果不同,考虑的主要分析。这信息是特别相关的敏感性分析,排除一些研究;例如,那些有偏见的风险很高。

重要的是,所有额外的分析应进行报道,而不仅仅是那些在统计学上意义重大。这些信息将帮助避免选择性报告结果偏差在审查已经证明了随机对照试验的报告[42],[44],[121],[151],[152]。探索性小组或敏感性分析的结果应该被谨慎,考虑潜在的多个分析误导。

讨论

24项:总结的证据。

总结主要发现,包括证据的强度为每个主要结果;考虑他们的相关关键组(例如,卫生保健提供者、用户和决策者)。

的例子。“总的来说,证据是不够健壮的确定比较的有效性血管成形术(有或没有支架)和医疗。只有2的随机试验与长期结果和第三个随机试验,允许大量交叉治疗3个月后直接血管成形术和医疗…随机试验相比不够评估患者或没有遵循病人足够时间允许的结论对临床结果,死亡率和心血管或肾衰竭等事件。

一些可接受的证据来自比较医学治疗和血管成形术长期肾功能的建议没有区别,但是可能是更好的血压控制血管成形术后,效果可能仅限于双边动脉粥样硬化性肾动脉狭窄患者。关于其他结果是弱的证据。因为审查的研究并没有明确地址快速临床恶化患者可能需要急性干预,我们的结论并不适用于这一重要子集的病人。”[143]

解释。

作者应该给出一个简短的和平衡的性质和结果的总结回顾。有时候,结果很少或没有数据被发现应该注意由于对政策决策和未来潜在的相关性研究。适用性评审的结果,不同的患者,设置,或目标受众,例如,应该提到。虽然没有标准的方法来评估适用性不同的受众,同时一些系统确实存在[153]。有时候,作者正式率或评估整体的证据审查和解决可以展示他们的总结与建议的强度评估质量的证据(例如,等级制度)[10]

作者需要记住,统计学意义的影响并不总是建议临床或政策的相关性。同样,非重大的结果并不证明治疗是无效的。作者应该明确权衡和价值观如何连接到主要的结果会导致不同的人做出不同的决定。此外,熟练的作者是重要的考虑因素在翻译的证据不同的设置和修改影响的评估报告的审核[153]。病人和卫生保健提供者可能主要感兴趣的干预是最有可能为一个好处提供可接受的伤害,而政策制定者和管理者可能对组织的影响和资源利用价值数据。

25项:限制。

讨论限制研究和成果水平(例如,偏见的风险),以及审查级别(例如,不完整的识别研究,检索报告的偏见)。

的例子。结果水平:

“这里的荟萃分析报告结合数据研究以评估治疗效果比是可能的在一个单一的研究更精确。这个荟萃分析的主要限制,对于任何概述,是患者人群,抗生素疗法,在研究结果的定义是不一样的。”[154]

研究和评估水平:

“我们的研究也有一些局限性。不同的质量研究。在所有试验随机化是足够的;然而,7的文章没有显式地声明,坚持意向处理分析数据的原则,这可能导致高估这些试验的治疗效果和我们不能评估质量的4 5试验报告的摘要。分析不确定组件之间的一个关联的质量和re-bleeding风险,和支持联合治疗的效果仍然显著,当我们排除试验报告为抽象。

发表偏倚可能占了我们观察到的一些影响。小试验,一般来说,不如更大规模的研究方法论的严格分析,一个不对称的漏斗图表明,选择性报道可能导致过高的影响大小的小型试验。”[155]

解释。

局限性的讨论应该解决的有效性(即。,risk of bias) and reporting (informativeness) of the included studies, limitations of the review process, and generalizability (applicability) of the review. Readers may find it helpful if authors discuss whether studies were threatened by serious risks of bias, whether the estimates of the effect of the intervention are too imprecise, or if there were missing data for many participants or important outcomes.

限制搜索的审查过程可能包括限制(例如,限制英语出版物),以及任何困难选择的研究中,评价和荟萃分析过程。例如,贫穷或不完整的报告的研究设计,患者群体,包括研究的干预可能会妨碍解释和合成[84]。适用性的评估可能影响如果有有限的数据对某些人群或子组的干预可能会执行不同的或感兴趣的一些研究评估最重要的结果;或者如果有大量的数据与一个过时的干预或比较器或严重依赖总结归责缺失值估计(14项)。

26项:结论。

提供一个通用的解释结果的其他证据,并对未来的研究。

的例子。实践意义:

“1995年至1997年五个不同的荟萃分析抗生素预防感染和死亡率的影响发表。所有确认显著减少感染,虽然效果的大小不同的从一个审查到另一个。估计影响总体死亡率明显减少,产生了相当大的争议成本效益的治疗。中只有一个可用的五个评论,然而,表明存在弱呼吸道感染和死亡率之间的联系和缺乏足够的统计能力,可能占有限影响死亡率。”

影响的研究:

“未来试验的一个合乎逻辑的下一步将是该协议的比较方案的系统性抗生素剂只有局部组件是否可以删除。我们已经确定了六个这样的试验,但病人的总数目前登记(n = 1056)太小我们相信这两个治疗同样有效。如果假设因此被认为是值得测试更多的和更大的随机对照试验是必要的。这样的试验,但是,不会解决相关问题的治疗诱导阻力。产生一个令人满意的答案,研究用不同的设计将是必要的。尽管详细讨论超出了本文的范围,研究重症监护室的而不是个别病人随机单元和抗生素耐药性的发生的监控在很长一段时间应该承担。”[156]

解释。

系统的评论家有时过于乐观的得出结论[157]或不认真考虑危害同样的好处,尽管一些证据表明这些问题减少[158]。如果结论不能因为有可靠的研究太少,或者太多的不确定性,这应该说。这样的发现可以从几个大型研究发现一致的作用一样重要。

作者应该试着与其他证据审查的结果,这有助于读者更好的解释结果。例如,可能还有其他系统评价的一般主题使用了不同的方法或解决相关但不同的问题[159],[160]。同样的,可能会有额外的信息与决策者有关,如成本效益的干预(例如,卫生技术评估)。作者可能的上下文中讨论的结果审查现有证据关于其他干预措施。

我们建议作者也明确对未来研究的建议。2535年样本Cochrane综述,包括82%的建议研究与特定的干预措施,建议适当的类型的参与者,30%和52%的建议措施,未来的研究结果[161]。没有相应的评估系统的评论发表在医学期刊上,但我们相信,这种建议是更常见的在这些评论。

临床研究不应该计划没有全面了解类似的,现有的研究[162]。有证据表明,这仍然没有出现,因为它和作者的主要研究不应该考虑系统回顾他们的设计研究[163]。我们相信系统评价有指导未来的临床研究潜力巨大。

资金

27项:资金。

描述的资金来源或其他支持的数据)(例如,供应系统综述;系统综述的资助者的角色。

例子:“基于本文的证据合成是由疾病控制与预防中心的卫生保健研究和质量和美国预防服务工作小组”。[164]

”角色的资金来源:资助者在研究设计没有发挥作用,收集、分析、解释数据,写报告的,或决定提交投稿。他们不接受责任的内容。”[165]

解释。

作者的评论,像任何其他研究,应披露任何资助他们进行审查,如果评审不资助或状态。Lexchin和他的同事们[166]观察到的结果的随机试验和临床试验的荟萃分析的报告由制药行业更有可能支持赞助商的产品相比,研究与其他的资金来源。类似的结果报告[167],[168]。类似的数据表明,类似的偏见可能影响系统评价的结论[169]

考虑到潜在的系统评价在决策中的作用,我们认为作者应该透明的资金和资助者的角色,如果任何。有时资助者提供服务,如图书管理员完成搜索相关文献或访问商业评论家数据库不可用。任何级别的资金或服务提供系统回顾团队应该报道。作者也应报告资助者是否有任何角色的行为或报告审查。除了资金问题,作者应该报告任何真实的或者所感知到的利益冲突与他们的角色或资助者的角色相关的报告系统的审查[170]

300年的一项调查显示,系统评价发表在2004年11月,在41%的资金来源没有报告的评论[3]。只有少数报告的评论(2%)资助的盈利来源,但真正的比例可能会更高[171]

额外的考虑为非随机干预研究的系统评价或其他类型的系统评价

棱镜的声明和本文档集中在系统评价的随机试验的报告。其他的研究设计,包括非随机研究,准实验研究,即,打断了时间序列,包括在一些系统评价,评估卫生保健干预措施的效果[172],[173]。这些评论可能不同的方法在不同程度的典型的干涉检查,例如关于文献检索,数据抽象,偏见的风险评估和分析方法。因此,他们的报告要求也可能不同于我们这里描述。有用的原则是系统综述作者报告,以确保他们的方法以足够的清晰度和透明度使读者能够批判性的判断或更新现有的证据和复制研究。

在一些系统的评论,作者将寻求原始数据从原始的研究人员计算汇总统计。这些系统评价称为个别病人(或参与)数据审核[40],[41]。个体患者数据荟萃分析也可以进行与潜在的积累数据而不是回顾现有的数据积累。,额外的信息需要报道的方法。

其他类型的系统评价存在。现实主义评论的目标是确定复杂的程序在特定的上下文和设置工作[174]。叙事评论旨在解释复杂的身体通过映射和比较不同证据统领的故事情节[175]。网络荟萃分析,也称为多重治疗荟萃分析,可用于分析数据的比较不同治疗方法[176],[177]。他们同时使用直接和间接的比较,可以用来比较干预没有直接比较。

我们相信,我们已经强调了本文相关的问题以确保透明度和理解的过程和信息的局限性提出了不同类型的系统评价。我们希望棱镜可以更详细的基础指导其他类型的研究的系统评价,包括诊断准确性和流行病学研究。

讨论

我们开发的棱镜语句使用一个方法在这些年的发展方针,发展报告[178]。棱镜的总体目标是帮助确保报告的清晰度和透明度的评论,和最近的数据表明,该报告指导是急需的[3]。棱镜并不打算成为一个质量评估工具,它不应该被使用。

这个棱镜的解释和细化文档是为了方便理解,吸收,和传播的棱镜声明,希望提供一个教学框架对于那些感兴趣的进行和报告系统评价。它遵循的格式类似于在其他解释性文件[17],[18],[19]。建议在棱镜后清单可能会增加系统回顾报告的字数。然而,我们相信,读者的利益能够批判性地评价一个清晰的、完整的、透明的系统回顾报告超过了报告的长度可能轻微增加。

而棱镜的目的是减少缺陷的风险报告系统评价和提高清晰度和透明度如何进行评论,我们没有数据状态更加明确地这个“干预”是否实现其预期目标。之前的努力评估QUOROM没有成功完成[178]。QUOROM声明的发布被推迟了两年,一个研究小组试图进行随机对照试验评估其有效性的八个主要医学期刊的参与。不幸的是试验没有完成由于权责发生制问题(大卫·莫赫个人通信)。其他评价方法可能更容易进行。至少一个公布的139年调查急救护理文献的系统评价[179]表明其质量改善QUOROM出版后。

如果棱镜语句认可和遵守期刊,其他报告指南[17],[18],[19],[180],应该有改进报告系统评价的证据。例如,有一些评估是否使用配偶提高随机对照试验的报告。这些研究的系统评价[181]表明使用配偶与改善报告的某些项目,如分配隐藏。我们的目标是评估的好处(即。,improved reporting) and possible adverse effects (e.g., increased word length) of PRISMA and we encourage others to consider doing likewise.

即使我们没有进行系统的文献检索来生产我们的清单,这的确是一个限制我们的努力,棱镜仍然是发达国家使用一个基于证据的方法,只要有可能。清单项目包括如果有证据表明不报告项目与风险增加有关的偏见,或很明显,信息是必要的,以评估评估的可靠性。保持棱镜的更新和尽可能的以证据为基础的需要定期警惕的文学,这是快速增长。目前Cochrane方法注册有超过11000条记录有关的行为和报告系统评价和其他评估健康和社会保健。对于一些清单项目,比如报告摘要(项目2),我们使用来自其他地方的证据相信这个问题同样适用于系统评价报告。然而,其他物品,证据不存在;例如,训练是否能够提高数据提取的准确性和可靠性。我们希望棱镜作为催化剂时帮助生成进一步的证据,可以考虑在未来进一步修改清单。

十多年的发展之间是通过QUOROM声明及其更新,棱镜的声明。我们的目标是更频繁地更新棱镜。我们希望棱镜的实现将会比它已经QUOROM。至少有两个理由保持乐观。首先,越来越多地采用系统评价卫生保健提供者通知“最佳实践”病人护理。政策分析师和经理使用系统评价告知医疗决策,并更好的未来的研究目标。第二,我们预期受益于赤道的发展网络,下面描述。

开发任何报告准则需要相当大的努力,经验,和专业知识。虽然报告指南已经成功的个人努力[17],[18],[19],有可能其他人想要发展报告准则拥有一些时间,经验,或知识如何适当地这样做。赤道网络(加强卫生研究的质量和透明度)旨在帮助这样的个人和团体感兴趣的同学,作为一个全球资源开发报告指南,无论焦点[7],[180],[182]。赤道的总体目标是提高报告的质量所有健康科学研究的发展和翻译报告指南。除此之外的目的,网络计划开发一个大型网站开发和维护资源中心的报告工具,报告研究和其他信息(http://www.equator-network.org/)。

我们鼓励卫生保健杂志和编辑组织,如世界医学编辑和协会的国际医学期刊编辑委员会,支持棱镜一样他们支持其他报告指南,如配偶。我们也鼓励卫生保健期刊的编辑支持棱镜更新他们的“作者”,包括棱镜网址,和提高意识通过特定的编辑操作。

支持信息

图S1。

流的信息通过系统回顾的不同阶段(可下载的模板文档人员重用)。

https://doi.org/10.1371/journal.pmed.1000100.s001

(0.08 MB的医生)

文本S1。

检查表的项目包括在报告系统回顾和荟萃分析(可下载的模板文档人员重用)。

https://doi.org/10.1371/journal.pmed.1000100.s002

(0.04 MB的医生)

确认

本文以下人员的贡献:

道格·奥特曼、DSc、医学统计中心(英国牛津大学);Gerd什么博士,大学医院的弗莱堡(德国弗莱堡);大卫·阿特金斯博士英里每小时,卫生服务研究和开发服务,退伍军人健康管理局(华盛顿特区。,美国);维吉尼亚州的巴伯,MRCP检查,DPhil,《公共科学图书馆·医学》杂志上(英国剑桥);尼克叫卖小贩博士东安大略省儿童医院(加拿大渥太华);杰西柏林,ScD,强生制药研发(泰特斯维尔,新泽西,美国);Jocalyn克拉克博士《公共科学图书馆·医学》杂志上(在撰写本文时,BMJ英国,伦敦,);迈克·克拉克博士,英国Cochrane中心(英国牛津大学)和护理和助产学学院的三一学院(爱尔兰都柏林);黛博拉·库克,医学博士,医学、临床流行病学和生物统计学,麦克马斯特大学(加拿大汉密尔顿市);罗伯特·D中保博士意大利迪摩德纳e Reggio Emilia(意大利摩德纳)和Centro Cochrane犬,史Ricerche Farmacologiche马里奥·内格里(意大利米兰);乔纳森·j·Deeks博士,伯明翰大学(英国伯明翰);p . j .审视中国医学博士,医学、临床流行病学和生物统计学,麦克马斯特大学(加拿大汉密尔顿市);凯Dickersin博士,约翰霍普金斯大学彭博公共卫生学院(巴尔的摩,马里兰州,我们);马提亚Egger博士社会预防医学,大学伯尔尼(瑞士伯尔尼);Edzard Ernst,医学博士,FRCP FRCP(艾丁)半岛医学院(英国埃克塞特);彼得·c·Gøtzsche MD, MSc,北欧科克伦中心(丹麦哥本哈根); Jeremy Grimshaw, MBChB, PhD, FRCFP, Ottawa Hospital Research Institute (Ottawa, Canada); Gordon Guyatt, MD, Departments of Medicine, Clinical Epidemiology and Biostatistics, McMaster University (Hamilton, Canada); Julian Higgins, PhD, MRC Biostatistics Unit (Cambridge, UK); John P. A. Ioannidis, MD, University of Ioannina Campus (Ioannina, Greece); Jos Kleijnen, MD, PhD, Kleijnen Systematic Reviews Ltd (York, UK) and School for Public Health and Primary Care (CAPHRI), University of Maastricht (Maastricht, Netherlands); Tom Lang, MA, Tom Lang Communications and Training (Davis, California, US); Alessandro Liberati, MD, Università di Modena e Reggio Emilia (Modena, Italy) and Centro Cochrane Italiano, Istituto Ricerche Farmacologiche Mario Negri (Milan, Italy); Nicola Magrini, MD, NHS Centre for the Evaluation of the Effectiveness of Health Care – CeVEAS (Modena, Italy); David McNamee, PhD, The Lancet (London, UK); Lorenzo Moja, MD, MSc, Centro Cochrane Italiano, Istituto Ricerche Farmacologiche Mario Negri (Milan, Italy); David Moher, PhD, Ottawa Methods Centre, Ottawa Hospital Research Institute (Ottawa, Canada); Cynthia Mulrow, MD, MSc, Annals of Internal Medicine (Philadelphia, Pennsylvania, US); Maryann Napoli, Center for Medical Consumers (New York, New York, US); Andy Oxman, MD, Norwegian Health Services Research Centre (Oslo, Norway); Ba' Pham, MMath, Toronto Health Economics and Technology Assessment Collaborative (Toronto, Canada) (at the time of the first meeting of the group, GlaxoSmithKline Canada, Mississauga, Canada); Drummond Rennie, MD, FRCP, FACP, University of California San Francisco (San Francisco, California, US); Margaret Sampson, MLIS, Children's Hospital of Eastern Ontario (Ottawa, Canada); Kenneth F. Schulz, PhD, MBA, Family Health International (Durham, North Carolina, US); Paul G. Shekelle, MD, PhD, Southern California Evidence Based Practice Center (Santa Monica, California, US); Jennifer Tetzlaff, BSc, Ottawa Methods Centre, Ottawa Hospital Research Institute (Ottawa, Canada); David Tovey, FRCGP, The Cochrane Library, Cochrane Collaboration (Oxford, UK) (at the time of the first meeting of the group,BMJ英国,伦敦,);彼得特格韦尔,医学博士,硕士,FRCPC,渥太华大学人口健康研究所(加拿大渥太华)。

洛伦佐泥熔岩博士帮助准备和几个更新的手稿并协助准备的引用列表。

亚历山德罗Liberati担保人的手稿。

作者的贡献

ICMJE作者阅读和满足标准188bet手机版188bet手机版:艾尔DGA JT CM PCG JPAI MC PJD JK DM党派。论文的第一稿中写道:艾尔DGA JT JPAI DM。导致了写作论文的:艾尔DGA JT厘米PCG JPAI MC PJD JK DM。党派解释的概念和设计和细化声明:DGA JT DM。同意的建议:艾尔DGA JT CM PCG JPAI MC PJD JK DM党派。

引用

  1. 1。加拿大卫生研究院的研究(2006)随机对照试验注册/应用程序清单(12/2006)。可用:http://www.cihr-irsc.gc.ca/e/documents/rct_reg_e.pdf。2009年5月26日访问。
  2. 2。年轻的C,霍顿R(2005)把临床试验为背景。《柳叶刀》366:107 - 108。
  3. 3所示。泰兹拉夫莫赫D J, Tricco AC,桑普森M,奥特曼DG(2007)流行病学和报告系统评价的特征。科学硕士4:e78。
  4. 4所示。Dixon E, Hameed M,萨瑟兰F,库克DJ,多依格C(2005)评价在普通外科文献荟萃分析:一个关键的评估。安杂志241:450 - 459。
  5. 5。赫默尔先生我,韦森特C,距首都普里什蒂纳H,马森MJ, Einarson TR(2004)质量评估的荟萃分析相关的药物治疗的重度抑郁症。咕咕叫地中海Res当今20:477 - 484。
  6. 6。李余金W, R, W,联络L, L, et al .(2008)荟萃分析的报告质量改善:随机抽样研究。中国论文61:770 - 775。
  7. 7所示。莫赫D,知己我,舒尔茨KF,霍利J,奥特曼DG(2008)帮助编辑,同行评议者和作者提高清晰度,完整性和透明度报告卫生研究。BMC医学6:13。
  8. 8。莫赫D,库克DJ,伊斯特伍德年代,Olkin我,兰尼D, et al .(1999)提高报告质量的随机对照试验的荟萃分析:QUOROM语句。荟萃分析的报告质量。《柳叶刀》354:1896 - 1900。
  9. 9。男性希金斯被绿色的年代,艾德森P,克拉克M, Mulrow CD, et al。(2008)第1章:系统回顾是什么?:希金斯被绿色的年代,编辑器。Cochrane系统评价干预措施的手册版本5.0.0(2008年2月更新)。Cochrane协作。可用:http://www.cochrane-handbook.org/。2009年5月26日访问。
  10. 10。Guyatt GH,奥克斯曼广告,通用电气,考察昆兹R, Falck-Ytter Y, et al。(2008)等级:一个新兴共识评级的证据质量和推荐的力量。BMJ 336: 924 - 926。
  11. 11。希金斯JPT,奥特曼DG(2008)第八章:风险评估包括偏见的研究。:希金斯被绿色的年代,编辑器。Cochrane系统评价干预措施的手册版本5.0.0(2008年2月更新)。Cochrane协作。可用:http://www.cochrane-handbook.org/。2009年5月26日访问。
  12. 12。莫赫D, Liberati泰兹拉夫,J,奥特曼DG,棱镜组(2008)首选项报告系统评价和荟萃分析:棱镜的声明。科学硕士6:e1000097。10.1371 / journal.pmed.1000097。
  13. 13。阿特金斯D,芬克K, Slutsky J(2005)更好的信息更好的卫生保健:循证实践中心项目和卫生保健研究和质量。安实习生地中海142:1035 - 1041。
  14. 14。希尔芬迪M, Balshem H(2009)发展指导原则:AHRQ和有效的医疗保健计划。中国论文。在出版社。
  15. 15。希金斯JPT、绿色年代(2008)5.0.0 Cochrane系统评价干预措施的手册版本(2008年2月更新)。Cochrane协作。可用:http://www.cochrane-handbook.org/。2009年5月26日访问。
  16. 16。评论和传播中心(2009)系统评价:CRD的指导进行评论的卫生保健。纽约:纽约大学。可用:http://www.york.ac.uk/inst/crd/systematic_reviews_book.htm。2009年5月26日访问。
  17. 17所示。奥特曼DG,舒尔茨KF,莫赫D, Egger M,大卫杜夫F, et al .(2001)修订的CONSORT声明报告随机试验:解释和细化。安实习生地中海134:663 - 694。
  18. 18岁。Bossuyt点,Reitsma JB、布鲁斯·德·Gatsonis CA, Glasziou PP、et al。(2003)诊断准确性的标准报告研究声明:解释和细化。化学49:7 - 18。
  19. 19所示。Vandenbroucke JP,冯榆树E,奥特曼DG, Gøtzsche PC, Mulrow CD, et al。(2007)加强流行病学的观察性研究报告(闪光灯):解释和细化。科学硕士4:e297。
  20. 20.巴克,Maratos EC,埃德蒙兹L, Lim E(2007)胸腔镜与开放手术的复发率pneumothoraces复发的预防:系统回顾的随机和non-randomised试验。《柳叶刀》370:329 - 335。
  21. 21。格兰•G, Nikolova D, Gluud LL Simonetti RG, Gluud C(2007)死亡率随机试验的抗氧化补充剂初级和二级预防:系统回顾和荟萃分析。《美国医学会杂志》297:842 - 857。
  22. 22。Montori VM, Wilczynski问,摩根D,海恩斯RB(2005)从Medline检索系统评价的最优搜索策略:分析调查。BMJ 330: 68。
  23. 23。黄Bischoff-Ferrari哈,威利•WC, JB, Giovannucci E,迪特里希T, et al .(2005)断裂与维生素D补充剂预防:随机对照试验的荟萃分析。《美国医学会杂志》293:2257 - 2264。
  24. 24。D,霍普韦尔年代,克拉克M,莫赫赌E,米德尔顿P, et al。(2008)的配偶在期刊和会议摘要报告随机试验。《柳叶刀》371:281 - 283。
  25. 25。D,霍普韦尔年代,克拉克M,莫赫赌E,米德尔顿P, et al。(2008)配偶随机对照试验报告在杂志和会议摘要:解释和细化。科学硕士5:e20。
  26. 26岁。海恩斯RB, Mulrow CD,胡特EJ,奥特曼DG,加德纳乔丹(1990)更多信息抽象再现。安实习生地中海113:69 - 76。
  27. 27。Mulrow CD,普塞克是某人,JA(1988)建议更多的评论文章的摘要。安实习生地中海108:613 - 615。
  28. 28。从P,从J(1993)缺陷中结构化医学抽象。中国论文46:591 - 594。
  29. 29。哈特利J(2000)澄清的抽象系统的文学评论。牛地中海Libr Assoc 88: 332 - 337。
  30. 30.哈特利J,悉德M, Blurton(1996)准确、快速获取信息:结构抽象更有效率呢?J公司Sci 22: 349 - 356。
  31. 31日。可以排除SJ,休斯医学博士李RJ(1987)在临床试验的报告统计问题。三个医学期刊的调查。郑传经地中海J 317: 426 - 432。
  32. 32。Taddio,疼痛T, Fassos FF,恩H, Ilersich, et AL . (1994) nonstructured质量和结构化的抽象的原始研究的文章在《英国医学杂志》上,加拿大医学协会期刊》和《美国医学协会杂志》上。协会学报150:1611 - 1615。
  33. 33。哈里斯KC, Kuramoto路,舒尔茨M, Retallack说道我(2009)校本体育运动干预对身体质量指数的影响在孩子们:一个荟萃分析。协会学报180:719 - 726。
  34. 34。詹姆斯太,康利J, Tonelli M, Manns BJ,麦克雷J, et al。(2008)荟萃分析:抗生素对血液透析导管相关感染的预防。安实习生地中海148:596 - 605。
  35. 35。Counsell C(1997)制定问题和定位主要研究包含在系统评价。安实习生地中海127:380 - 387。
  36. 36。Gotzsche PC(2000)为什么我们需要一个广泛的视角荟萃分析。它可能对患者至关重要。BMJ 321: 585 - 586。
  37. 37岁。格罗斯曼P, Niemann L,施密特年代,瓦拉几人的H(2004)正念减压和健康的好处。一个荟萃分析。J Psychosom Res 57: 35-43。
  38. 38。勃氏G,绿色的年代,希金斯JPT Kjeldstrøm M, N,杰克逊et al。(2008)第二章:Cochrane审查做准备。:希金斯被绿色的年代,编辑器。Cochrane系统评价干预措施的手册版本5.0.0(2008年2月更新)。Cochrane协作。可用:http://www.cochrane-handbook.org/。2009年5月26日访问。
  39. 39岁。萨顿AJ,艾布拉姆斯KR,琼斯博士,谢尔登•TA歌F(1998)试验和其他研究的系统评价。健康评估生物抛光工艺2:1 - 276。
  40. 40。埃尼迪斯JP,罗森博格PS, Goedert JJ, O ' brien TR(2002)评论:荟萃分析的个体在遗传流行病学参与者的数据。我增加156:204 - 210。
  41. 41岁。斯图尔特洛杉矶,克拉克乔丹(1995)的实际方法荟萃分析(概述)使用更新个体患者数据。科克伦工作组。地中海统计14:2057 - 2079。
  42. 42。陈啊,Hrobjartsson Haahr MT, Gøtzsche PC,奥特曼DG(2004)的实证证据表明选择性报告结果的随机试验:比较协议发表文章。《美国医学会杂志》291:2457 - 2465。
  43. 43。Dwan K,奥特曼DG, Arnaiz是的,布鲁姆J,陈啊,et al .(2008)系统评价研究的经验证据发表偏倚和结果报告的偏见。《公共科学图书馆•综合》3:e3081。
  44. 44岁。Silagy CA,米德尔顿P,霍普韦尔年代(2002年)出版协议的系统评价:比较所作的计划。《美国医学会杂志》287:2831 - 2834。
  45. 45岁。评论和传播中心(2009)的研究项目。纽约:纽约大学。可用:http://www.crd.york.ac.uk/crdweb。2009年5月26日访问。
  46. 46岁。乔安娜·布里格斯研究所(2009)协议和工作进展。可用:http://www.joannabriggs.edu.au/pubs/systematic_reviews_prot.php。2009年5月26日访问。
  47. 47岁。Bagshaw SM,足总去,Manns BJ, Ghali佤邦(2006)乙酰半胱氨酸在对比感应肾病的预防:一个案例研究的缺陷发展的证据。地中海拱形实习生166:161 - 166。
  48. 48。Biondi-Zoccai GG, Lotrionte M, Abbate,前者甲壳L, Remigi E, et al。(2006)遵守QUOROM和重叠的荟萃分析的报告质量对乙酰半胱氨酸的角色对比相关肾病的预防:案例研究。BMJ 332: 202 - 209。
  49. 49。麻袋HS,贝瑞J,莱特曼D, Ancona-Berk VA,查尔莫斯TC(1987)随机对照试验的荟萃分析。郑传经地中海J 316: 450 - 455。
  50. 50。Schroth RJ Hitchon CA, Uhanova J, Noreddin, Taback SP, et al。(2004)对慢性肾功能衰竭患者乙肝疫苗接种。科克伦数据库系统转速。问题3:CD003775。cd003775.pub2 doi: 10.1002/14651858.。
  51. 51。Egger M, Zellweger-Zahner T,施耐德,破车C, Lengeler C, et al。(1997)语言偏见在英语和德语发表的随机对照试验。《柳叶刀》350:326 - 329。
  52. 52岁。戴德里安格雷戈勒克,F,勒洛里J(1995)选择的语言出版物包括荟萃分析:有通天塔的偏见吗?中国论文48:159 - 163。
  53. 53岁。尤尼P, Holenstein F, Sterne J,巴特利特C, Egger M(2002)方向和影响语言偏见的对照试验分析:实证研究。Int增加31:115 - 123。
  54. 54。莫赫D,范教授B,克拉森TP,舒尔茨KF,柏林JA, et al .(2000)除英语之外的其他语言做什么贡献荟萃分析的结果吗?中国论文53:964 - 972。
  55. 55。锅Z, Trikalinos助教,Kavvoura颗,刘J,埃尼迪斯JP(2005)地方文献的偏见在遗传流行病学:实证评估的中国文学。科学硕士2:e334。
  56. 56。霍普韦尔年代,麦当劳,克拉克M, Egger M(2007)灰色文献在随机试验的荟萃分析卫生保健干预措施。科克伦数据库系统转速。问题2:MR000010。mr000010.pub3 doi: 10.1002/14651858.。
  57. 57。Melander H, Ahlqvist-Rastad J,梅耶尔G, Beermann B(2003)证据B (i)为此medicine-Selective报道研究由制药行业:新药的研究应用。BMJ 326: 1171 - 1173。
  58. 58岁。萨顿AJ, Duval SJ Tweedie RL,艾布拉姆斯KR,琼斯博士(2000)的实证评估发表偏倚的影响的荟萃分析。BMJ 320: 1574 - 1577。
  59. 59。Gotzsche PC(2006)可信度相对风险和优势比摘要:横断面研究。BMJ 333: 231 - 234。
  60. 60。班达里M,审视PJ, Guyatt GH,库克DJ, Swiontkowski MF, et al .(2002)骨科抽象的观察性研究和随后的全文出版物。中华骨科杂志是84:615 - 621。
  61. 61年。Rosmarakis ES、Soteriades ES Vergidisπ,Kasiakou SK, Falagas我(2005)从会议论文全文文摘:资料在会议和期刊之间的区别。美国实验生物学学会联合会19:673 - 680。
  62. 62年。生田斗真M,足总去,面包卷L,亚当斯D,范德米尔B, et al。(2006)从会议文摘过渡到完整的期刊文章随机对照试验。《美国医学会杂志》295:1281 - 1287。
  63. 63年。桑德斯Y,罗斯·JR Broadley KE,埃德蒙兹点,Patel年代(2004)系统检查血钙过多的磷酸盐治疗恶性肿瘤。地中海Palliat 18: 418 - 431。
  64. 64年。Shojania公斤,桑普森M,安萨里山,霁J,多赛特年代,et al。(2007)如何快速做系统评价的日期吗?生存分析。安实习生地中海147:224 - 233。
  65. 65年。Bergerhoff K, Ebrahim年代,帕莱塔和G(2004),我们需要考虑的过程中引用搜索策略?12日Cochrane讨论会;2004年10月2 - 6;加拿大安大略省渥太华。可用:http://www.cochrane.org/colloquia/abstracts/ottawa/p - 039. htm。2009年5月26日访问。
  66. 66年。张L,桑普森米、麦高文J(2006)报告的专家搜索者在Cochrane综述的作用。基于Evid Libr信息Pract 1: 3-16。
  67. 67年。特纳呃,马修斯,Linardatos E,告诉RA,罗森塔尔R(2008)选择性的抗抑郁药物试验及其影响明显的功效。郑传经地中海J 358: 252 - 260。
  68. 68年。Alejandria MM, Lansang妈,在低频,Mantaring简森-巴顿(2002)静脉注射免疫球蛋白治疗脓毒症和脓毒性休克。科克伦数据库系统转速。问题1:CD001090。cd001090 doi: 10.1002/14651858.。
  69. 69年。高德年代,麦金托什嗯,达菲年代,一个被J(2006)发展有效的搜索策略来确定在MEDLINE和EMBASE副作用的报道。健康信息Libr J 23: 3 - 12。
  70. 70年。山米、麦高文J,起到E, Grimshaw J,莫赫D, et al。(2009)同行评审的循证实践指南的电子搜索策略。中国论文。E-pub 2009年2月18日。
  71. 71年。Flores-Mir C,重大MP, PW(2006)搜索和选择正畸治疗的系统评价方法(2000 - 2004)。是J灰土Dentofacial . 130: 214 - 217。
  72. 72年。重大MP, PW, Flores-Mir C(2006)搜索和选择的评价方法用于牙科系统评价发表在英语。J是削弱Assoc 137: 1252 - 1257。
  73. 73年。大议员大PW, Flores-Mir C(2007)基准测试报告的搜索和选择牙科专业的系统评价方法。基于Evid削弱8:66 - 70。
  74. 74年。沙先生,Hasselblad V,史蒂文森LW, Binanay C,奥康纳厘米,et al .(2005)危重患者的肺动脉导管的影响:随机临床试验的荟萃分析。《美国医学会杂志》294:1664 - 1670。
  75. 75年。爱德华兹P,克拉克M, DiGuiseppi C,普拉塔普,罗伯茨,et al。(2002)识别随机对照试验的系统评价:检查记录的准确性和可靠性。Stat地中海21:1635 - 1640。
  76. 76年。库珀嗯,博尔RG(1989)影响文献搜索的结果综合研究的评论。知识10:179 - 201。
  77. 77年。Mistiaen P·E(2006)电话随访,由医院卫生专业人员,出院后患者出院回家的问题。科克伦数据库系统转速。问题4:CD004510。cd004510.pub3 doi: 10.1002/14651858.。
  78. 78年。琼斯美联社,Remmington T,威廉姆森公关,阿什比D,史密斯RL(2005)高流行但低影响的数据提取和报告错误被发现在Cochrane系统评价。中国论文58:741 - 742。
  79. 79年。克拉克M,霍普韦尔年代,Juszczak E, Eisinga, Kjeldstrom M(2006)压缩袜子在乘客预防深静脉血栓形成。科克伦数据库系统转速。问题2:CD004002。cd004002.pub2 doi: 10.1002/14651858.。
  80. 80年。有轨电车先生,雷诺兹DJ,摩尔RA,人尽其才HJ(1997)影响的隐性重复出版在荟萃分析:一个案例研究。BMJ 315: 635 - 640。
  81. 81年。冯榆树E, Poglia G,困境B,电车先生(2004)不同的模式重复的出版物:用于系统评价的分析文章。《美国医学会杂志》291:974 - 980。
  82. 82年。Gotzsche PC(1989)出版多个药品试验的报告。36欧元中国新药杂志:429 - 432。
  83. 83年。艾伦C,霍普韦尔年代,普伦蒂斯(2005)非甾体抗炎药对女性的子宫内膜异位疼痛。科克伦数据库系统转速。问题4:CD004753。cd004753.pub2 doi: 10.1002/14651858.。
  84. 84年。Glasziou P, E肉类,Heneghan C, Shepperd年代(2008)什么是缺少治疗试验的描述和评论?BMJ 336: 1472 - 1474。
  85. 85年。Tracz MJ,明星K, Bolona呃,哈达德RM,肯尼迪CC, et al。(2006)男性睾丸激素使用和它对骨骼健康的影响。随机安慰剂对照临床试验的系统回顾和荟萃分析。中国性金属底座91:2011 - 2016。
  86. 86年。布赫HC, Hengstler P,辛德勒C, Guyatt GH(2000)经皮穿冠状血管成形术和医学治疗冠心病表示:随机对照试验的荟萃分析。BMJ 321: 73 - 77。
  87. 87年。Gluud LL临床干预研究(2006)的偏见。我增加163:493 - 501。
  88. 88年。Pildal J, Hrobjartsson约根森KJ,希尔登J,奥特曼DG, et al。(2007)分配隐藏对结论的影响来自随机试验的荟萃分析。Int增加36:847 - 857。
  89. 89年。泥熔岩LP Telaro E D中保R, Moschetti我,Coe L, et al。(2005)主要研究的方法学质量评价系统评价:结果metaquality横断面研究。BMJ 330: 1053。
  90. 90年。莫赫D, Jadad AR,特格韦尔P(1996)评估随机对照试验的质量。188bet体育备用网址当前的问题和未来的发展方向。Int J抛光工艺评估医疗12:195 - 208。
  91. 91年。桑德森年代,梭织ID,希金斯JP(2007)工具来评估质量和易感性的偏见在流行病学观察研究:系统回顾和注释的书目。Int增加36:666 - 676。
  92. 92年。格陵兰岛(1994)邀请评论:一个关键看一些流行的整合方法。我增加140:290 - 296。
  93. 93年。尤尼P,奥特曼DG, Egger M(2001)在卫生保健系统评价:评估临床试验的质量控制。BMJ 323: 42-46。
  94. 94年。昆兹R,奥克斯曼广告(1998)不可预测性悖论:审查经验比较的随机和non-randomised临床试验。BMJ 317: 1185 - 1190。
  95. 95年。犹豫EM,博尼斯PA,莫斯科维茨H,施密德CH,埃尼迪斯JP, et al。(2002)相关的质量度量估计治疗效果的随机对照试验的荟萃分析。《美国医学会杂志》287:2973 - 2982。
  96. 96年。审视PJ,比蒂WS,崔PT, Badner NH, Guyatt GH, et al。(2005)有多强的证据进行非心脏手术围手术期β受体阻滞剂的使用?随机对照试验的系统性回顾和荟萃分析。BMJ 331: 313 - 321。
  97. 97年。审视PJ,班达里M, Montori VM, Manns BJ, Ghali佤邦,et al。(2002)双盲,你最弱的link-Good-bye !ACP J俱乐部136:A11。
  98. 98年。范Nieuwenhoven CA, Buskens E, van Tiel FH,粗毛格子围巾乔丹(2001)方法论的审判之间的关系质量和选择性消化道去污的影响肺炎和危重患者的死亡率。《美国医学会杂志》286:335 - 340。
  99. 99年。Guyatt GH,库克D,审视PJ,米德M,施特劳斯年代(2002)治疗。用户指南医学文献。AMA出版社。55 - 79页。
  100. One hundred.Sackett DL,绅士在计算和将M(1979)争议事件的临床试验。郑传经地中海J 301: 1410 - 1412。
  101. 101年。Montori VM,审视PJ, Adhikari NK,伯恩斯KE,艾格特CH, et al。(2005)随机试验停止过早的好处:系统回顾。《美国医学会杂志》294:2203 - 2209。
  102. 102年。Guyatt GH,审视PJ(2002)治疗和有效性:意向处理的原则。:Guyatt GH,兰尼博士、编辑。用户指南医学文献。AMA出版社。267 - 273页。
  103. 103年。柏林JA(1997)致盲的读者影响荟萃分析的结果吗?宾夕法尼亚大学荟萃分析研究小组眼睛发花。《柳叶刀》350:185 - 186。
  104. 104年。Jadad AR,摩尔RA,卡罗尔D,詹金森C,雷诺兹DJ, et al。(1996)随机临床试验的评估报告的质量:到处都是必要的吗?控制试验17:1 - 12。
  105. 105年。皮塔饼AG, Siegel RD,刘J(2004)胰岛素治疗重病住院病人:随机对照试验的荟萃分析。地中海拱形实习生164:2005 - 2011。
  106. 106年。Lakhdar R, Al-Mallah MH, Lanfear德(2008)的安全性和耐受性血管紧张素转换酶抑制剂和血管紧张素转换酶抑制剂和血管紧张素受体阻滞剂的患者左心室功能障碍:随机对照试验的系统性回顾和荟萃分析。J卡失败14:181 - 188。
  107. 107年。Bobat R, Coovadia H,斯蒂芬·C Naidoo KL, McKerrow N, et al。(2005)的安全性和有效性在南非与hiv - 1感染儿童补锌:随机双盲安慰剂对照试验。《柳叶刀》366:1862 - 1867。
  108. 108年。Deeks JJ,奥特曼DG(2001)影响的荟萃分析办法,试验与二进制的结果。史密斯:Egger M, GD,奥特曼DG,编辑。在医疗保健系统评价:荟萃分析。第二版。伦敦:BMJ出版集团。
  109. 109年。选择Deeks JJ(2002)问题的汇总统计分析与二进制的临床试验的结果。Stat地中海21:1575 - 1600。
  110. 110年。恩格斯EA,施密德CH, Terrin N, Olkin我,刘J(2000)异质性和荟萃分析的统计学意义:125年荟萃分析的实证研究。Stat地中海19:1707 - 1728。
  111. 111年。Tierney摩根富林明,斯图尔特,Ghersi D, Burdett年代,悉德先生(2007)实际将总结比较数据纳入荟萃分析的方法。实验八:16。
  112. 112年。博得特•年代,Piedbois P, S Syz N, L,斯图尔特et al。(2005)分析只有平均存活时间:与个体患者数据比较结果。Int J抛光工艺评估医疗21:119 - 125。
  113. 113年。Briel M,瑞士思德利公司M,玻璃TR,布赫HC(2004)他汀类药物对预防中风的影响,没有冠心病患者:随机对照试验的荟萃分析。地中海117:596 - 606。
  114. 114年。琼斯M, Schenkel B J, Fallowfield L(2004)重组提高癌症患者的生活质量:metaanalysis的结果。癌症101:1720 - 1732。
  115. 115年。Elbourne博士,奥特曼DG,希金斯JP,科廷F,沃辛顿高压,et al。(2002)涉及交叉试验的荟萃分析:方法论的问题。Int增加31:140 - 149。
  116. 116年。Follmann D,艾略特P, Suh I, J·卡特勒(1992)方差归责与连续反应临床试验概述。中国论文45:769 - 773。
  117. 117年。Wiebe N,范德米尔B,普拉特RW,克拉森TP,莫赫D, et al。(2006)系统回顾标识缺乏标准化处理丢失的方差数据的方法。中国论文59:342 - 353。
  118. 118年。带头人Hrobjartsson, Gotzsche PC(2004)安慰剂干预临床条件。科克伦数据库系统转速。问题2:CD003974。cd003974.pub2 doi: 10.1002/14651858.。
  119. 119年。Shekelle PG、莫顿SC Maglione M, Suttorp M,你W, et al。(2004)药物和手术治疗肥胖。Evid代表工艺评估(夏)1 - 6。
  120. 120年。陈啊,奥特曼DG(2005)识别结果报告的偏见在PubMed随机试验:审查出版物和作者的调查。BMJ 330: 753。
  121. 121年。威廉姆森的公关,赌博C(2005)识别和选择偏见在荟萃分析结果的影响。统计24:1547 - 1561。
  122. 122年。威廉姆森的公关,赌博C,奥特曼DG,赫顿杰(2005)在荟萃分析结果选择偏见。统计方法地中海Res 14: 515 - 524。
  123. 123年。埃尼迪斯JP, Trikalinos助教(2007)发表偏倚的适当性的不对称测试荟萃分析:一个大型调查。协会学报176:1091 - 1096。
  124. 124年。Briel M,施瓦茨GG,汤普森PL, de Lemos是的,炽热的妈,et al。(2006)早期治疗效果与他汀类药物在急性冠状动脉综合征的短期临床结果:随机对照试验的荟萃分析。《美国医学会杂志》295:2046 - 2056。
  125. 125年。歌F,伊斯特伍德AJ, Gilbody年代,Duley L,萨顿AJ出版(2000年)和相关的偏见。健康评估生物抛光工艺4:1 - 115。
  126. 126年。施密德CH,鲜明的PC,柏林JA,兰黛P,刘J(2004)多元回归发现异构治疗效果和学习水平之间的联系,但不是患者的立场,因素。中国论文57:683 - 697。
  127. 127年。希金斯JP,汤普森SG(2004)控制假从多元回归结果的风险。Stat地中海23:1663 - 1682。
  128. 128年。汤普森SG,希金斯JP(2005)治疗个人4:荟萃分析可以帮助目标干预个人最有可能受益?《柳叶刀》365:341 - 346。
  129. 129年。Uitterhoeve RJ, Vernooy M, Litjens M,盆栽K,本斯J, et al .(2004)患者心理社会干预措施先进无知文献的系统评价。Br J癌症91:1050 - 1062。
  130. 130年。Fuccio L,赛季我,Zagari RM,格雷利D, Magrini N, et al。(2007)荟萃分析:一线服用ppi三联疗法为基础的持续时间幽门螺杆菌根除。安实习生地中海147:553 - 562。
  131. 131年。史密斯Egger M, GD(1998)偏见的位置和选择研究。BMJ 316: 61 - 66。
  132. 132年。Ravnskov U(1992)降低胆固醇试验在冠心病:引文和结果的频率。BMJ 305: 15 - 19。
  133. 133年。后D,展位一个(2007)卫生技术评估符合QUOROM图指导吗?一个实证研究。BMC医学Res Methodol 7: 49。
  134. 134年。Curioni C,安德烈C(2006)利莫那班对于超重或肥胖。科克伦数据库系统转速。问题4:CD006162。cd006162.pub2 doi: 10.1002/14651858.。
  135. 135年。逃亡LR,拜尔利JS, Doshi N,施泰纳乔丹(2008)使用止吐剂在急性胃肠炎代理:系统回顾和荟萃分析。拱Pediatr Adolesc地中海162:858 - 865。
  136. 136年。Pakos EE,埃尼迪斯JP(2004)放射治疗与非甾体类抗炎药后异位骨化的预防主要臀部程序:随机试验的荟萃分析。Int J Radiat杂志杂志phy 60: 888 - 895。
  137. 137年。Skalsky K, Yahav D, Bishara J, Pitlik年代,Leibovici L, et al。(2008)人类布鲁氏菌病的治疗:系统回顾和荟萃分析的随机对照试验。BMJ 336: 701 - 704。
  138. 138年。奥特曼DG, Cates C(2001)需要单独试验结果在系统评价的报道。BMJ。快速反应。
  139. 139年。Gotzsche PC, Hrobjartsson很K, Tendal B(2007)数据提取错误使用标准均数差值的荟萃分析。《美国医学会杂志》298:430 - 437。
  140. 140年。刘易斯,克拉克M(2001)森林情节:试图看到木头和树。BMJ 322: 1479 - 1480。
  141. 141年。Papanikolaou PN,埃尼迪斯JP(2004)的大规模的证据在特定危害系统评价的随机试验。地中海117:582 - 589。
  142. 142年。Duffett M, Choong K, Ng V,兰多夫,库克DJ(2007)表面活性剂治疗儿童急性呼吸衰竭:系统回顾和荟萃分析。暴击治疗11:R66。
  143. 143年。犹豫E,拉曼G,钟M, Ip, Tatsioni, et al .(2006)对肾动脉狭窄的有效性管理策略:一个系统的复习。安实习生地中海145:901 - 912。
  144. 144年。纳尔逊EA Palfreyman年代,迈克尔是下肢静脉溃疡(2007)调料:系统回顾和荟萃分析。BMJ 335: 244。
  145. 145年。埃尼迪斯JP, Patsopoulos NA, Evangelou E(2007)异质性估计在荟萃分析的不确定性。BMJ 335: 914 - 916。
  146. 146年。阿普尔顿公里,海沃德RC, Gunnell D,彼得斯TJ,罗杰斯PJ, et al。(2006) n - 3长链多不饱和脂肪酸对抑郁情绪的影响:系统回顾发表的试验。是中国减轻84:1308 - 1316。
  147. 147年。Kirsch我执事BJ Huedo-Medina结核病,Scoboria,摩尔TJ, et al。(2008)最初的严重程度和抗抑郁药物的好处:一个荟萃分析的数据提交给美国食品和药物管理局。科学硕士5:e45。
  148. 148年。赖兴巴赫年代,Sterchi R,谢勒M, Trelle年代,Burgi E, et al。(2007)荟萃分析:软骨素膝关节或髋关节骨关节炎的。安实习生地中海146:580 - 590。
  149. 149年。Hodson EM,克雷格•JC Strippoli GF,韦伯斯特AC(2008)抗病毒药物预防巨细胞病毒疾病实体器官移植受者。科克伦数据库系统转速。问题2:CD003774。cd003774.pub3 doi: 10.1002/14651858.。
  150. 150年。汤普森SG,希金斯JP(2002)应该如何进行多元回归分析和解释?Stat地中海21:1559 - 1573。
  151. 151年。陈啊,Krleza-Jeric K,施密德,奥特曼DG(2004)随机试验结果报告的偏见加拿大卫生研究院资助的研究。协会学报171:735 - 740。
  152. 152年。哈恩年代,威廉姆森公关,赫顿杰,获得P,弗林EV(2000)评估潜在的偏见的荟萃分析由于选择性报告在研究的亚组分析。Stat地中海19:3325 - 3336。
  153. 153年。绿色LW,格拉斯哥(2006)评价相关性、泛化,在外部验证和适用性的研究:问题和翻译方法。Eval健康教授29日:126 - 153。
  154. 154年。Liberati A、D中保R Torri V, Brazzi L, Pifferi(2004)抗生素预防减少呼吸道感染和死亡率在成人接受重症监护。科克伦数据库系统转速。问题1:CD000022。cd000022.pub2 doi: 10.1002/14651858.。
  155. 155年。冈萨雷斯R,扎莫拉J, Gomez-Camarero J, Molinero LM, Banares R, et al。(2008)荟萃分析:结合内窥镜和药物治疗来防止静脉曲张的肝硬化出血。安实习生地中海149:109 - 122。
  156. 156年。Leonetti C, D中保R, Pifferi年代,Torri V, Tinazzi, et al。(1998)抗生素预防成人危重患者的有效性:随机对照试验的系统评价。BMJ 316: 1275 - 1285。
  157. 157年。带头人奥尔森啊,米德尔顿P, Ezzo J, Gotzsche PC,鲍勃V, et al。(2001) Cochrane综述:质量评估样本1998。BMJ 323: 829 - 832。
  158. 158年。克拉克霍普韦尔年代,沃尔芬登L, M(2008)的不良事件报告系统的评论可以提高:调查结果。中国论文61:597 - 602。
  159. 159年。吕富做DJ, BK, Guyatt GH, Heyland DK,格里菲斯勒,et al。(1996)压力溃疡预防危重病人。解决不和谐的荟萃分析。《美国医学会杂志》275:308 - 314。
  160. 160年。Jadad AR,库克DJ, Browman GP(1997)指南解释不一致的系统的评论。协会学报156:1411 - 1416。
  161. 161年。克拉克,克拉克,克拉克T (2007) Cochrane综述识别研究需要有什么用?Res J卫生服务政策12:101 - 103。
  162. 162年。(没有作者列出)(2000年)世界医学协会赫尔辛基宣言:伦理原则涉及人类受试者的医学研究。《美国医学会杂志》284:3043 - 3045。
  163. 163年。克拉克M,霍普韦尔年代,查尔默斯我(2007)临床试验的报告应该开始和结束的最新的系统评价其他相关证据:状态报告。J R Soc地中海100:187 - 190。
  164. 164年。杜布C, Rostom,列文G, Tsertsvadze,叫卖小贩N, et al。(2007)的使用阿司匹林一级预防大肠癌:系统回顾美国预防服务工作组准备。安实习生地中海146:365 - 375。
  165. 165年。奎奇立J,贝茨(2005)血红蛋白颜色没有贫血诊断实验室规模:一个系统的复习。Int增加34:1425 - 1434。
  166. 166年。Lexchin J, Bero LA,克拉克Djulbegovic B O(2003)制药行业赞助和研究结果和质量:系统性回顾。BMJ 326: 1167 - 1170。
  167. 167年。陈Als-Nielsen B, W, Gluud C, Kjaergard LL(2003)协会的资金和在随机药物试验结论:治疗效果的反映或不良事件?《美国医学会杂志》290:921 - 928。
  168. 168年。胡椒J,血液E,维纳E,鹧鸪制药(2007)联系介入和结果在乳腺癌的临床试验。癌症109:1239 - 1246。
  169. 169年。猛拉V,兰尼D, Bero拉(2007)之间的金融关系和和谐荟萃分析的结果和结论:回顾性队列研究。BMJ 335: 1202 - 1205。
  170. 170年。约根森啊,希尔登J, Gøtzsche PC (2006) Cochrane综述与行业支持荟萃分析和其他荟萃分析相同的药物:系统性回顾。BMJ 333: 782。
  171. 171年。Gotzsche PC, Hrobjartsson,约翰森港元,Haahr MT,奥特曼DG, et al。(2007)鬼作者采用的工业随机试验。科学硕士4:e19。
  172. 172年。阿克巴里,梅休,Al-Alawi M, Grimshaw J, Winkens R, et al。(2008)干预措施改善从初级保健门诊转诊到二级护理。科克伦数据库系统转速。问题2:CD005471。cd005471.pub2 doi: 10.1002/14651858.。
  173. 173年。戴维斯P,坎贝尔Boruch R(2001)合作。BMJ 323: 294 - 295。
  174. 174年。格林哈尔希Pawson R, T,哈维G,沃尔什K(2005)现实主义书评系统评价的新方法用于复杂的政策干预。Res J卫生服务政策10:(1)还是。
  175. 175年。格林哈尔希T,罗伯特·G麦克法兰F,软化P, Kyriakidou O, et al .(2005)故事情节在创新扩散的研究:一个叙事系统评价方法。社科地中海61:417 - 430。
  176. 176年。Lumley T(2002)网络荟萃分析间接治疗比较。Stat地中海21:2313 - 2324。
  177. 177年。埃兹Salanti G,希金斯JP, AE,埃尼迪斯JP(2008)评估网络的随机试验。统计方法地中海Res 17: 279 - 301。
  178. 178年。奥特曼DG,莫赫D(2005)[发展中医疗报告指南研究:科学原理和程序。]。地中海(巴克)125:17(1)8日至13日。
  179. 179年。德莱尼,Bagshaw SM, Ferland Manns B, Laupland KB, et al。(2005)系统评价急救护理质量的荟萃分析的文献。暴击治疗9:r575 - 582。
  180. 180年。奥特曼DG,知己我,霍利J,莫赫D,舒尔茨K(2008)赤道:报告卫生研究的指导方针。《柳叶刀》371:1149 - 1150。
  181. 181年。操练椅AC,莫赫D,莫里森,舒尔茨K,奥特曼DG, et al。(2006)的配偶清单提高报告质量的随机对照试验?系统回顾。欧斯特185:263 - 267。
  182. 182年。知己我奥特曼DG莫赫D,舒尔茨KF,霍利J(2008)健康研究报告指南:赤道网络指南的作者的调查。科学硕士5:e139。
  183. 183年。去年JM(2001)流行病学的字典。牛津:牛津大学出版社&国际流行病学协会。
  184. 184年。Antman EM,刘J, Kupelnick B, F Mosteller,查尔默斯TC(1992)比较的随机对照试验的荟萃分析的结果和建议的临床专家。治疗心肌梗塞。《美国医学会杂志》268:240 - 248。
  185. 185年。奥克斯曼广告,Guyatt GH(1993)审查的科学研究。安N Y科学703:125 - 133。讨论133 - 124。
  186. 186年。奥康纳D,绿色的年代,希金斯JPT(2008)第五章:定义审查问题,包括研究开发标准。:希金斯被绿色的年代,编辑器。Cochrane系统评价干预措施的手册版本5.0.0(2008年2月更新)。Cochrane协作。可用:http://www.cochrane-handbook.org/。2009年5月26日访问。
  187. 187年。McDonagh M,白粉P,布拉德利M,库珀J,萨顿,et al .(2000)系统回顾公共水氟化反应。协议变更(附录M)。NHS中心评论和传播。纽约:纽约大学。可用:http://www.york.ac.uk/inst/crd/pdf/appm.pdf。2009年5月26日访问。
  188. 188年。莫赫D,库克DJ, Jadad AR,特格韦尔P,莫赫M, et al .(1999)评估报告的质量的随机试验:影响的荟萃分析。健康评估生物抛光工艺3:i-iv, 1 - 98。
  189. 189年。审视PJ,崔PT El-Dika年代,班达里M, Montori VM, et al .(2004)一项观察性研究发现,随机对照试验的作者经常利用隐蔽的随机化和致盲,尽管未能报告这些方法。中国论文57:1232 - 1236。
  190. 190年。苏亚雷斯惠普,丹尼尔斯年代,库马尔,克拉克M,斯科特•C et al .(2004)糟糕的报告并不意味着糟糕的随机试验的方法:随机对照试验进行的观察研究肿瘤放射治疗组。BMJ 328: 22 - 24。
  191. 191年。Liberati Himel HN,查尔默斯TC(1986)随机对照试验的质量评估乳腺癌的主要治疗。中华肿瘤防治杂志4:942 - 951。
  192. 192年。莫赫D, Jadad AR Nichol G,笔者M,特格韦尔P, et al。(1995)评估随机对照试验的质量:一个带注释的书目的尺度和清单。控制试验16:62 - 73。
  193. 193年。格陵兰岛的年代,O’rourke K(2001)在分析偏差产生的质量分数,和层次结构,提出了解决方案。生物统计学2:463 - 471。
  194. 194年。尤尼P, Witschi,布洛赫R, Egger M(1999)评分的临床试验质量的危害分析。《美国医学会杂志》282:1054 - 1060。
  195. 195年。弗莱斯杰(1993)统计分析的基础。地中海Res统计方法2:121 - 145。
  196. 196年。维拉J,麦基我Carroli G,唐纳(2001)荟萃分析的随机对照试验的系统评价围产期医学:比较固定和随机效应模型。Stat地中海20:3635 - 3647。
  197. 197年。刘J,埃尼迪斯JP,施密德CH(1998)总结证据:一个答案并不总是足够的。《柳叶刀》351:123 - 127。
  198. 198年。DerSimonian R, Laird N(1986)在临床试验的荟萃分析。控制试验7:177 - 188。
  199. 199年。猎人我,施密特FL(2000)固定效应和随机效应分析模型:影响累积研究知识。Int J选取评估8:275 - 292。
  200. 200年。Deeks JJ,奥特曼DG Bradburn乔丹(2001)统计方法研究非均质性,结合一些研究结果的荟萃分析。:Egger M,戴维史密斯G,奥特曼DG,编辑。在医疗保健系统评价:荟萃分析。伦敦:BMJ出版集团。285 - 312页。
  201. 201年。斯皮格尔霍尔特警告DE,汤普森SG, DJ(2002)贝叶斯随机效应分析与二进制结果:试验方法绝对风险差异和相对风险。Stat地中海21:1601 - 1623。
  202. 202年。希金斯JP,汤普森SG, Deeks JJ,奥特曼在荟萃分析DG(2003)测量不一致。BMJ 327: 557 - 560。
  203. 203年。希金斯JP,汤普森SG(2002)量化分析异质性。Stat地中海21:1539 - 1558。
  204. 204年。Huedo-Medina结核病,Sanchez-Meca J, Marin-Martinez F, Botella J(2006)评估异质性荟萃分析:统计或I2索引?Psychol方法11:193 - 206。
  205. 205年。汤普森SG,特纳RM,警告德(2001)多层次分析模型,和他们的应用程序的绝对风险差异。统计方法地中海Res 10: 375 - 392。
  206. 206年。Dickersin K(2005)发表偏倚:识别问题,了解它的起源和范围,防止伤害。:Rothstein人力资源,萨顿AJ,伯伦斯坦M,编辑。发表偏倚在meta-analysis-Prevention,评估和调整。西萨塞克斯郡:约翰威利和儿子。
  207. 207年。谢勒RW, Langenberg P·冯·榆树E(2007)最初提出了抽象的结果公布。科克伦数据库系统转速。问题2:MR000005。mr000005.pub3 doi: 10.1002/14651858.。
  208. 208年。Krzyzanowska可,Pintilie M, Tannock如果(2003)与未能发布大型随机试验相关的因素在一个肿瘤会议。《美国医学会杂志》290:495 - 501。
  209. 209年。霍普韦尔年代,克拉克M(2001)方法学家和他们的方法。方法学家写了他们的会议演讲或只是15分钟的名人吗?Int J抛光工艺评估医疗17:601 - 603。
  210. 210年。Ghersi D(2006)问题的设计、实施和报告的临床试验,影响决策的质量。博士论文。悉尼:公共卫生学院,医学院,悉尼大学。
  211. 211年。冯榆树E,转入一个,Blumle Huwiler K, Witschi M, et al。(2008)出版,干脆不临床试验:纵向研究的应用程序提交研究伦理委员会。138年瑞士医疗工作:197 - 203。
  212. 212年。Sterne JA, Egger M(2001)漏斗图检测偏差分析:选择轴的指导方针。中国论文54:1046 - 1055。
  213. 213年。哈伯德RM, Egger M, Sterne JA(2006)修改测试小型研究与二进制端点效应对照试验的荟萃分析。统计25:3443 - 3457。
  214. 214年。彼得斯JL萨顿AJ,琼斯博士,艾布拉姆斯KR,拉什顿L(2006)比较两种方法检测发表偏倚的荟萃分析。《美国医学会杂志》295:676 - 680。
  215. 215年。Rothstein人力资源,萨顿AJ,伯伦斯坦M(2005)发表偏倚分析:预防、评估和调整。西萨塞克斯郡:约翰威利和儿子。
  216. 216年。刘J,埃尼迪斯JP, Terrin N,施密德CH, Olkin我(2006)的情况下误导漏斗图。BMJ 333: 597 - 600。
  217. 217年。Terrin N,施密德CH,刘J(2005)的实证评价漏斗图,研究人员无法直观地识别发表偏倚。中国论文58:894 - 901。
  218. 218年。Egger M,戴维史密斯G,施耐德,看守者C(1997)偏差分析检测到一个简单的、图形化的测试。BMJ 315: 629 - 634。
  219. 219年。埃尼迪斯JP, Trikalinos助教(2007)的探索性测试过多的重大发现。实验4:245 - 253。
  220. 220年。Sterne江淮,Egger M,莫赫D(2008)第十章:解决报告偏见。:希金斯被绿色的年代,编辑器。Cochrane系统评价干预措施的手册版本5.0.0(2008年2月更新)。Cochrane协作。可用:http://www.cochrane-handbook.org/。2009年5月26日访问。