用于医疗保健专业人士

分析对证据的质量和建议的力度进行评级

等级:对证据的评价质量和强度的建议达成的共识

BMJ2008;336DOI:https://doi.org/10.1136/bmj.39489.470347.AD(2008年4月24日出版)引用如下:BMJ2008; 336:924
  1. 戈登^ h亚特, 教授1
  2. 安德鲁·d奥克斯曼研究员2
  3. 耿氏E参观研究员2
  4. 里贾纳昆茨, 副教授3
  5. Yngve法尔克 - Ytter, 助理教授4
  6. 巴勃罗Alonso-Coello研究员
  7. 霍尔格Ĵ许内曼, 教授6
  8. 对于GRADE工作组
  1. 1加拿大汉密尔顿市麦克马斯特大学临床流行病学和生物统计学系,邮编L8N 3Z5
  2. 2挪威知识中心的卫生服务,邮政信箱7004,圣奥拉维斯赛普拉斯,0130奥斯陆,挪威
  3. 3巴塞尔临床流行病学研究所,巴塞尔大学医院,巴塞尔,瑞士巴塞尔4031号
  4. 4消化内科,案例医学中心,凯斯西储大学,美国俄亥俄州克里夫兰市44106,美国部
  5. 伊比利亚美洲Cochrane中心,SERVICIO德Epidemiología服务ClínicaŸ每期Pública(自治大学巴塞罗那),圣保罗医院,巴塞罗那08041,西班牙
  6. 6流行病学,意大利国家癌症研究所里贾纳莲娜,罗马,意大利的系
  1. 通讯作者:G H亚特,CLARITY研究小组,临床流行病学与卫生统计学系,室2C12,1200大街,西汉密尔顿,ON,加拿大L8N 3Z5亚特{在} mcmaster.ca

准则是在他们如何评价证据的质量和推荐强度不一致。本文探讨了GRADE系统,该系统被越来越多的组织通过全球范围内的优势

要点总结

  • 不考虑证据的质量可能导致误入歧途的建议;激素替代疗法为绝经后妇女提供了一个有益的例子

  • 有力的证据表明,干预的预期效果明显大于预期效果,或者明显不大于预期效果

  • 关于权衡的不确定性(低质量的证据,或者因为需要和不需要的影响,因为有密切的平衡)认股权证弱推荐

  • 准则应告知医生什么的基本证据的质量和建议是否强或弱

  • 建议评估,制定和评价的分级(级)方法提供了证据等级质量和推荐强度是明确,全面,透明,务实,越来越被组织通过全球系统

世界各地的开发人员指引在他们如何评价的证据和建议等级强度质量不稳定。其结果是,指导用户面临的理解是分级系统试图传达消息的挑战。自2006年以来BMJ已要求在其“作者须知”上bmj.com,作者最好使用建议评估,制定和评估(级)系统的分级提交了一份临床指南的文章时,分级证据。请问这个决定背后?

在这第一个在一系列的五篇文章,我们将解释为什么许多组织使用正规的系统级证据和建议,为什么这是临床医生很重要;我们将专注于GRADE方法的建议。在接下来的两篇文章中,我们将探讨GRADE系统如何categorises的证据和推荐强度质量。最后两篇文章将集中在诊断测试和等级对解决措施对资源利用的影响框架的建议。

等级有比以前的评级系统(框1)优势。其他系统共享其中的一些优点,但没有,比其他等级,结合他们。1

专栏1比其它系统级优势

  • 受国际指南制定具有广泛代表性的小组开发

  • 明确区分证据的质量和建议的力度

  • 的替代管理战略成果的重要性,明确的评价

  • 证据评级降级和升级品质明确的,全面的标准

  • 从证据搬到建议透明的过程

  • 明确承认价值观和偏好

  • 清除,对临床医生,患者和决策者弱建议稳健踏实解释

  • 用于系统审查和卫生技术评估,以及指导方针

什么是“质量的证据”,为什么它很重要?

在进行医疗管理决策,患者和医生必须权衡的好处和替代战略缺点。决策者不仅要通过的预期优点和缺点的最佳估计,也通过他们的这些估计的信心受到影响。漫画描绘了气象预报的不确定性捕获结果的可能性进行评估,并有信心在评估之间的差异(图)。对干预影响程度估计的有用性取决于我们对这一估计的信心。

临床专家和组织提供建议临床社区经常犯错由于没有充分顾证据质量的结果。2十年来,组织推荐临床医生鼓励绝经后妇女使用激素替代疗法。3许多初级保健医生在他们的做法,尽职尽责地应用这个忠告。

一种认为这种治疗方法可以显著降低女性心血管疾病风险的观点促使了这一建议。如果当时有一个严格的证据质量评估系统被应用,它会表明,由于数据来自观察性研究,结果不一致,心血管风险降低的证据质量很低。4证据的局限性的认识就会锻炼的建议。最后,随机对照试验显示,激素替代疗法不能减少心血管疾病的风险,甚至可能会增加。6

美国食品和药品管理局批准的抗心律失常药物恩卡胺和氟卡尼用于患者的药物,以减少猝死无症状的室性心律失常能力的基础上。这一决定没有承认,由于心律失常减少只体现在间接猝死的结果的证据为药品的利益质量是低质量的。随后,一个随机对照试验表明,这两种药物增加猝死的风险。7适当关注证据的低质量将有可能挽救成千上万人的生命。

没有认识到高品质的证据可能会导致类似的问题。举例来说,专家建议从滞后顺利进行的随机对照试验溶栓治疗心肌梗死的死亡率达到了降低证据落后十年。8

重视不足的证据质量的风险,可能会导致临床医生采取行动,他们的病人的损害不恰当的指导和建议。认识到的证据的质量,将有助于避免这些错误。

应该如何指南制定者警惕临床医生的证据质量?

正式的系统,有据例如,从高的categorises质量,以非常低的代表传达的证据质量,临床医师显而易见的策略。有一些限制,但确实存在。证据质量是连续的;任何离散分类涉及到一定程度的随意性。然而,简单,透明和鲜艳度的优点大于这些限制。

什么是“推荐力度”,为什么它很重要?

一项建议,为病人提供特定的治疗可以从大型,严谨的随机对照试验表明,副作用少和最少的不便和成本,一贯的出色效益出现。这样与使用口服类固醇的短期课程在哮喘患者的病情加重的情况。临床医生可以对几乎所有的患者很少或根本没有犹豫提供这种治疗。

另外,治疗建议可能来自观察性研究,可能涉及明显的伤害、负担或成本。决定是否对有人工心脏瓣膜的孕妇使用抗血栓治疗涉及权衡减少瓣膜血栓形成的程度与不便、成本和畸形形成的风险。提供这类治疗的临床医生必须帮助患者根据他们的价值观和喜好仔细权衡可取和不可取的效果。

因此,准则和建议必须表明是否(一个)证据是高质量和可取的影响明显超过了不可取的影响,或(b)中存在一种接近或不确定的平衡。简单、透明的推荐评级可以有效地传达这一关键信息。

有对建议正式分级限制。像证据的质量,需要的和不需要的效果之间的平衡反映了一个连续统一体。有些随意性因此将在类别放置特别建议,如“强”和相关的“弱”。生产方针大多数组织已经决定,建议的明确等级的优点大于缺点。

是什么让一个好的分级系统?

并非所有的分级系统中分离出来关于证据的推荐强度质量的决策。那些不这样做造成混乱。高品质的证据并不一定意味着强的建议,​​并且可以从低质量的证据出现的强烈建议。

例如,谁遇到没有明显的挑衅系数必须第一深静脉血栓形成,抗凝治疗的头几个月后的病人,决定是否继续服用华法林长期。高品质的随机对照试验显示,华法林继续将减少血栓复发的风险,但在出血和不便的风险增加的成本。由于患者有不同的价值观和偏好会做出不同的选择,指南小组解决患者是否应该继续或终止华法林应,尽管高品质的证据,提供了一个弱推荐。

考虑决定管辖阿司匹林或扑热息痛(对乙酰氨基酚)与水痘的儿童。观察研究发现阿司匹林管理和瑞氏综合征之间的关联。9由于阿司匹林和扑热息痛在镇痛和解热方面的作用相似,关于阿司匹林和雷氏综合征之间关系的低质量证据并不排除强烈推荐使用扑热息痛。

该分类“专家意见”作为证据类别系统也造成混乱。判断是必要的所有证据解释,证据是高还是低质量的。他们的临床经验的专家报告应明确标注为非常低质量的证据,有病例报告和其他不受控制的临床观察一起。

分级系统是相对于两对证据的质量和推荐强度的判断简单方便病人,临床医生和决策者使用。1详细和明确的质量评级和强度分级标准将使使用指导方针和建议的判断更加透明。

尽管很多分级系统在一定程度上满足这些条件,1系统过多,使它们的使用困难的一线临床医生。了解各种制度既不是有效的,也不是一个现实的使用临床医生的时间。等级系统广泛应用于:世界卫生组织,美国医师学院,美国胸科协会,UpToDate的(电子资源广泛应用于北美,www.uptodate.com)和Cochrane协作是都采用等级超过25个组织之一。这种广泛采用等级反映了GRADE的成功作为方法论严谨,人性化的分级制度。

如何证据的GRADE系统分类的质量?

为了达到透明度和简单性,等级制度将证据的质量分为四个等级——高、中、低和极低(框2)。一些使用等级制度的组织选择将低和极低的类别结合起来。基于随机对照试验的证据一开始是高质量的证据,但我们对证据的信心可能会因为以下几个原因而下降:

  • 研究的局限性

  • 结果不一致

  • 间接的证据

  • 不精确

  • 报告偏倚。

虽然观察性研究(例如,队列和病例对照研究)开始与“低质量”评级,分级向上可以如果治疗效果的大小是非常大的(如严重的髋关节的骨关节炎和髋关节置换),保证如果还有一个剂量 - 反应关系的证据,或者如果所有合理的偏差将降低的表观治疗效果的幅度。

证据和定义框2质量

  • 高质量- 进一步的研究是不太可能改变我们在效应的信心,

  • 温和的品质- 进一步的研究可能对我们的效应的信心,一个重要的影响,并可能改变估计

  • 低质量- 进一步的研究很可能对我们的效应的信心有重要的影响,并有可能改变估计

  • 很低的质量- 而有效的估计是非常不确定

如何GRADE系统考虑推荐强度?

等级系统提供两种等级的建议:“强”和“弱”(虽然指导小组可能更喜欢诸如“有条件”或“全权委托”,而不是弱)。当干预的理想的效果明显大于不良影响,或明显不这样做,指南小组提供了有力的建议。在另一方面,当权衡是少了一些,无论是由于低质量的证据,或者是因为有证据表明,需要和不需要的效果有密切的平衡弱的建议成为强制性。

除了证据的质量,其他几个因素影响的建议是否强或弱(表1)。

影响的建议的强度因素

查看该表:

脚注

  • 这是一系列的解释GRADE系统,以此来评定的证据和推荐强度质量五篇文章的第一。

  • 伊比利亚美洲科克伦中心是西班牙公共卫生网络流行病学家中心的一部分。

  • 在GRADE工作组的成员是菲尔·奥尔德森,巴勃罗·阿隆索 - 科埃略,杰夫·安德鲁斯,大卫·阿特金斯,希尔达巴斯蒂安,汉斯·德啤酒,贾恩·布罗泽克,弗朗索瓦丝Cluzeau,乔纳森·克雷格,本Djulbegovic,Yngve法尔克 - Ytter,比阿特丽斯Fervers,SIGNE弗罗托普,保罗Glasziou,戈登·亚特,罗宾港,玛格丽特·霍先生,马克·赫尔方,苏山,罗马Jaeschke,Kathatrine琼斯,伊尔卡Kunnamo,里贾纳昆兹,亚历山德罗·利伯拉蒂,梅尔切马索,詹姆斯·梅森,亚采Mrukovics,苏珊·诺里斯,安德鲁·奥克斯曼,维维安·罗宾逊,霍尔格许内曼,谭泰莎托雷斯,大卫·托维,彼得特格韦尔,玛莉丝卡哈Tuut,海伦娜Varonen,耿氏VIST,克雷格Wittington,约翰·威廉姆斯和詹姆斯·伍德科克。

  • 提供者:在GRADE工作组的所有成员贡献的手稿中的发展思路,并阅读并同意稿件。温室气体里写出了初稿,并整理作者和审稿随后的迭代意见。ADO,GEV,RK,YF-Y,PA-C,和HJS贡献了约的结构和内容,提供的实例中,原稿的审查连续草稿,并提供反馈的思想。温室气体是担保人。

  • 资金:没有具体的资金。

  • 相互竞争的利益:所有作者都参与了GRADE的传播,以及GRADE的成功对他们的学术生涯产生积极的影响。在署名上市作者已收到报销差旅费和酬金演示,其中包括GRADE的方法来评价证据的质量和分级的建议进行审查。温室气体充当顾问UpToDate的;他的工作包括在其使用档次UpToDate的帮助。HJS是美国胸科协会的文档编辑和方法;在这些位置他的职责之一是帮助实现使用级。他是支持“人的因素,流动和居里夫人行动科学家重返欧洲委员会授予:IGR 42192-GRADE。”

  • 来源和同行审查:没有委托;外部同行评议。

参考

视图抽象