用于医疗保健专业人员

分析评级的证据质量和推荐的力量

年级:一个新兴共识评级的证据质量和推荐的力量

BMJ2008年;336年doi:https://doi.org/10.1136/bmj.39489.470347.AD(2008年4月24日发表)引用这个:BMJ336:924 2008;
  1. 戈登·H Guyatt教授,1,
  2. 安德鲁·D奥克斯曼,研究员2,
  3. 耿氏E参观,研究员2,
  4. Regina昆兹副教授3,
  5. Yngve Falck-Ytter助理教授4,
  6. 巴勃罗Alonso-Coello,研究员5,
  7. Holger J Schunemann教授,6
  8. 年级工作组
  1. 1临床流行病学和生物统计学,麦克马斯特大学,汉密尔顿,加拿大z5 L8N 3
  2. 2挪威卫生服务中心知识,邮政信箱7004,圣康布特就0130年奥斯陆,挪威
  3. 3巴塞尔研究所的临床流行病学、巴塞尔大学医院Hebelstrasse 10, 4031年巴塞尔瑞士
  4. 4胃肠病学、医学中心,克利夫兰凯斯西储大学的哦,44106,美国
  5. 5伊比利亚美洲Cochrane中心Servicio de Epidemiologia我们y祝您健康上市(de巴塞罗那自治大学),圣保罗医院,08041年巴塞罗那,西班牙
  6. 6流行病学、意大利国家癌症研究所雷吉娜艾琳娜,罗马,意大利
  1. 函授:G H Guyatt清晰研究小组,部门临床流行病学和生物统计学,房间2 c12 1200大街,西汉密尔顿,加拿大z5 L8N 3guyatt在{}mcmaster.ca

指导他们如何率不一致的证据的质量和强度的建议。本文还探讨了评分系统的优势,越来越多地采用的全球机构

总结分

  • 不考虑质量的证据可能导致错误的建议;激素替代疗法对绝经后的妇女提供了一个很好的例子

  • 高质量的证据表明,干预的影响明显大于它的不良影响,或显然不是,权证强烈推荐

  • 不确定性的权衡(因为低质量证据或因为理想和不良影响是紧密平衡)权证疲软的建议

  • 指南应告知医生,底层的证据的质量和是否建议强弱

  • 建议的分级评估、开发和评价等级(级)的方法提供了一个系统的证据质量和推荐强度是显式的,全面、透明,务实和全球组织越来越多地采用

指导开发人员在世界各地在如何率不一致的证据质量和等级强度的建议。因此,指导用户面临挑战在理解评分系统试图传达的消息。自2006年以来,BMJ要求在其“作者”在bmj.com上,作者应该更好地使用建议的分级评估、开发和评估(年级)系统对证据分级时提交临床指南的一篇文章。这一决定背后是什么?

在第一个在一系列的五篇文章中,我们将解释为什么许多组织使用正式的系统级证据和建议,为什么这是重要的对临床医师;我们将关注成绩方法建议。在接下来的两篇文章我们将讨论如何评分系统分类的证据质量和推荐的力量。最后两篇文章将重点推荐诊断测试和年级的框架解决干预的影响利用资源。

成绩优于以前的评分系统(框1)。其他系统分享其中的一些优势,但没有,除了成绩,结合了他们所有人。1

箱1年级在其他系统的优点

  • 由开发人员广泛代表性的国际指导方针

  • 清晰的分离的证据质量和推荐的力量

  • 明确评估的结果替代管理策略的重要性

  • 明确、全面的标准降级和升级的证据质量评级

  • 透明的过程,从证据的建议

  • 明确承认价值观和偏好

  • 清晰、务实的强与弱的解释建议临床医生、患者,和政策制定者

  • 有用的系统评价与卫生技术评估,以及指导方针

什么是“证据”质量和为什么重要?

在医疗管理决策,患者和临床医生必须权衡选择策略的优点和缺点。将不仅影响决策者的最佳估计预期的优点和缺点也对这些估计的信心。卡通描绘天气预报员的不确定性捕获之间的差异的可能性的评估结果和评估(图的信心)。估计的有效性干预影响的大小取决于我们对估计的信心。

专家临床医生和临床社区组织提供建议经常错的结果没有充分考虑质量的证据。2十年来,组织建议临床医生鼓励绝经后妇女使用激素替代疗法。3许多初级保健医生尽职尽责地应用了这个建议的实践。

相信这种治疗大大降低妇女的心血管风险把这个建议。有一个严格的等级体系的质量证据被应用时,它会显示,因为数据来自于观察性研究不一致的结果,减少心血管疾病的风险的证据是非常低质量的。4识别的局限性的证据会缓和的建议。最终,随机对照试验表明,激素替代疗法未能减少心血管疾病的风险,甚至可能增加。56

美国食品和药品管理局批准抗心律失常的药物encainide和氟卡尼用于病人药物的能力的基础上减少无症状室性心律失常与突然死亡。这个决定未能承认,因为减少心律失常反映间接突然死亡的结果的证据的质量低质量的药物的好处。随后,一个随机对照试验表明,两种药物增加猝死的风险。7适当的低质量证据会挽救了成千上万人的生命。

未能认识到高质量证据会导致类似的问题。例如,专家建议十年落后的证据进行随机对照试验,在心肌梗死溶栓治疗达到减少死亡率。8

关注质量的证据不足风险不适当的指导方针和建议,可能导致临床医生采取行动损害病人的利益。承认证据的质量将有助于避免这些错误。

应该如何指导开发人员提醒临床医师质量的证据吗?

一个正式的系统分类质量的证据——例如,从高到非常low-represents传达一个明显的战略质量证据的临床医生。一定的局限性,但是,确实存在。质量的证据是一个连续统一体;任何离散分类涉及某种程度的任意性。然而,简单的优点、透明度和生动超过这些限制。

什么是“推荐”的力量为什么很重要?

建议提供特定治疗的患者可能出现从大型,严格的随机对照试验显示一致的令人印象深刻的好处很少有副作用和最小的不便和成本。情况就是这样使用短疗程的患者口服类固醇哮喘的发作。临床医生可以提供这样的治疗几乎所有病人很少或根本没有犹豫。

另外,治疗建议可能来自于观察性研究和涉及明显的危害,负担,或成本。决定是否使用抗凝治疗与心脏瓣膜假体包括孕妇体重减少阀血栓的大小与不便,成本和畸形发生的风险。临床医生提供这种治疗方法必须帮助病人仔细权衡可取的和不受欢迎的影响根据自己的价值观和偏好。

指导方针和建议必须指明(一)证据是高质量和理想的影响明显大于不良效果,或(b)有一个关闭或不确定的平衡。一个简单、透明的分级推荐可以有效地传达关键信息。

正式的评分有局限性的建议。像质量的证据,反映了连续平衡理想和负面影响。有些霸道会因此与放置特定的相关建议等类别的“强大”和“弱。“大多数组织生产指导方针决定一个显式的优点等级推荐利大于弊。

是什么让一个好的评分系统?

不是所有评分系统单独决定的证据强度质量的建议。那些失败造成混乱。高质量的证据并不一定意味着强烈的建议,并强烈建议可以从低质量证据出现。

例如,体验一次深静脉血栓形成的患者没有明显的引发因素必须,第一个月后抗凝,决定是否继续长期服用华法林。高质量的随机对照试验表明,持续的华法林将减少复发性血栓形成的风险但代价增加出血的风险和不便。因为患者不同的价值观和偏好做出不同的选择,指导小组解决病人是否应该继续或终止华法林should-despite优质evidence-offer疲软的建议。

考虑决定管理阿司匹林和扑热息痛(对乙酰氨基酚)儿童水痘。观察性研究发现阿司匹林之间的关联管理和雷氏症候群。9因为阿司匹林和扑热息痛止痛和退热的效果是相似的,低质量的证据关于阿司匹林和雷尔氏综合症之间的联系并不排除对扑热息痛的强烈建议。

系统分类“专家意见”作为一个类别的证据也会造成混乱。判断是必要的解释的证据,证据是否高或低质量。临床经验的专家报告应明确贴上很低质量证据,以及案例报告和其他不受控制的临床观察。

分级系统是简单的对判断证据的质量和强度的建议促进病人使用,临床医生和政策制定者。1详细和明确的标准评级的质量和等级的力量会使判断更加透明,那些使用指南和建议。

尽管许多评分系统在一定程度上满足这些标准,1大量的系统使他们对一线临床医生使用困难。了解各种系统既不有效也不实际使用临床医生的时间。等级系统被广泛用于:世界卫生组织,美国医师学会,美国胸科学会,现时的(电子资源广泛应用于北美,www.uptodate.com),和Cochrane协作超过25的组织采用了等级。这反映了年级广泛采用的成功是十分严格的,用户友好的评分系统。

证据的等级系统分类质量如何?

实现透明和简单,证据的等级系统分类质量的四个高,温和,低,极低(2盒)。一些组织使用等级系统选择结合低和非常低的类别。基于随机对照试验的证据开始于高质量的证据,但是我们的信心证据可能下降的原因有几个,其中包括:

  • 研究的局限性

  • 不一致的结果

  • 间接的证据

  • 不精确

  • 报告的偏见。

虽然观察性研究(例如,队列和病例对照研究)开始“低质量”评级,评级向上可能保证如果治疗效果非常大的大小(如严重的髋关节骨关节炎和髋关节置换),如果有剂量反应关系的证据或者所有合理的偏见减少明显治疗效果的大小。

框2的证据质量和定义

  • 高质量的——进一步的研究很可能改变我们的信心的估计效果

  • 温和的品质,进一步的研究可能会对我们的信心有重要影响的估计效果和可能改变估计

  • 低质量——进一步的研究很有可能对我们的信心有重要影响的估计效果和可能改变估计

  • 很低的质量-任何估计的效果是非常不确定的

推荐的等级系统考虑强度如何?

级系统提供了两个等级的建议:“强大”和“弱”(尽管指南面板可能更喜欢“条件”或“自由裁量”等术语而不是弱)。当理想的干预的影响明显大于不良效果,或明显不,指南面板提供了有力的建议。另一方面,当权衡少certain-either因为低质量证据或证据表明可取的和不受欢迎的影响密切balanced-weak成为强制性的建议。

除了证据的质量外,其他几个因素影响的建议是否强弱(表1所示)。

影响因素的强度的建议

把这个表:

脚注

  • 这是第一个在一系列的五篇文章,解释证据的等级评级系统质量和强度的建议。

  • 伊比利亚美洲科克伦的中心是西班牙公共卫生网络的一部分cib de Epidemiologia y祝您健康上市。

  • 年级工作组的成员是男性菲尔艾德森,巴勃罗Alonso-Coello,杰夫•安德鲁斯大卫·阿特金斯希尔达Bastian汉斯啤酒,Jan Brozek弗朗索瓦丝Cluzeau,乔纳森•克雷格·本·Djulbegovic Yngve Falck-Ytter,比阿特丽斯发烧,Flottorp负号,保罗•Glasziou戈登•Guyatt罗宾港湾,玛格丽特泛滥平原,马克希尔芬迪,苏山,罗马Jaeschke Kathatrine琼斯Ilkka Kunnamo, Regina昆兹亚历山德罗Liberati,梅西Marzo,詹姆斯·梅森Jacek Mrukovics,苏珊•诺里斯维维安·罗宾逊,Holger Schunemann,安德鲁·奥克斯曼泰Tan托雷斯,大卫•Tovey彼得•特格韦尔剧中Tuut,海伦娜Varonen Gunn考察,克雷格•卫丁顿约翰•威廉姆斯和詹姆斯·伍德考克。

  • 贡献者:年级工作小组的所有成员贡献的发展思想的手稿,手稿和阅读和批准。温室气体写第一稿,整理代码开发者和评审者的评论为后续迭代。ADO、GEV RK、YF-Y PA-C,和hj关于结构和内容,提供实例,综述了连续草稿的手稿,并提供反馈。温室气体是担保人。

  • 资助:没有具体的资金。

  • 利益冲突:所有作者都参与年级的传播,与品位的成功有积极影响的学术生涯。作者署名收到中列出的旅费和酬金的陈述,包括审查等级评级质量的证据和分级的方法建议。温室气体作为现时的顾问;他的工作包括帮助现时的使用等级。hj是文档编辑和美国胸科学会方法学家;在这些位置是帮助实现他的一个角色等级的使用。他支持“人的因素,流动性和居里夫人的行为科学家重新整合欧洲委员会格兰特:IGR 42192 -年级。”

  • 出处和同行评审:不是委托;外部同行评议。

引用

视图抽象