用于医疗保健专业人员

CC通过数控188滚球软件
研究方法和报告

配偶2010解释和阐述:更新指南报告平行组随机试验

BMJ2010年;340年doi:https://doi.org/10.1136/bmj.c869(2010年3月24日发表)引用这个:BMJ2010;340:c869

这篇文章有一个修正。请参阅:

  1. 大卫·莫赫资深科学家1,
  2. 莎莉霍普韦尔,高级研究员2,
  3. 肯尼斯·F舒尔茨杰出的科学家和副总统3,
  4. 维克多Montori医学教授4,
  5. 彼得·C Gøtzsche主任5,
  6. P J审视中国、临床学者6,
  7. 戴安娜Elbourne教授医疗评估7,
  8. 马提亚症主管部门和流行病学和公共健康教授8,
  9. 道格拉斯·G奥特曼教授,2
  1. 1渥太华方法中心、临床流行病学项目、渥太华医院研究所,渥太华,加拿大安大略省渥太华医院K1H 8 16种
  2. 2牛津大学医学中心统计,沃尔夫森学院,牛津大学
  3. 3家庭健康国际,美国27709年数控,三角研究园
  4. 4英国知识和遇到的研究单位,梅奥诊所,锰、美国罗彻斯特
  5. 5北欧科克伦中心、Rigshospitalet Blegdamsvej 9,丹麦哥本哈根
  6. 6加拿大汉密尔顿市麦克马斯特大学健康科学中心
  7. 7医疗统计单位,伦敦卫生和热带医学学院的伦敦
  8. 8社会预防医学研究所(重点),瑞士伯尔尼大学
  1. 函授:D胜景一览无余dmoher在{}ohri.ca
  • 接受2010年2月8日

文摘

压倒性的证据显示随机对照试验的质量报告(相关的)不是最优的。没有透明的报道,读者无法判断试验结果的信度和效度,也为系统评价提取信息。最近的方法论的分析表明,报告和设计不足与偏差估计的治疗效果。这样的系统误差是严重损害相关,这被认为是黄金标准评估干预措施,因为它们能够减少或避免偏见。

一组科学家和编辑了配偶(合并报告的标准试验)相关的语句来提高报告的质量。这是首次出版于1996年,2001年更新。声明由一个清单和流程图,作者可以使用一个随机对照试验报告。许多著名医学期刊和重大国际编辑组织支持CONSORT声明。声明有助于相关的关键评价和解释。

在2001年的配偶修订,显然,解释和精化的CONSORT声明背后的原则将有助于调查人员和其他人写或评价试验报告。配偶的解释和细化的一篇文章发表在2001年与2001年版的CONSORT声明。

专家会议后在2007年1月,CONSORT声明进一步修订,作为配偶2010年发表的声明。这个更新改善以前的清单和包含的措辞和清晰建议相关话题,最近才收到识别,如选择性报告结果偏差。

这说明和细化文件加强使用,理解,和传播的配偶声明也被广泛地修改。这礼物的意义和理由每个新的和更新的清单项提供良好的报告和例子,在可能的情况下,引用相关的实证研究。包括几个流图的例子。

2010年配偶声明,这个修改说明和细化文档,和相关的网站(www.consort-statement.org)应该有用的资源来提高随机试验的报告。

“整个医学取决于透明的报告的临床试验。”1

精心设计,妥善执行随机对照试验(相关的)提供最可靠的医疗干预措施的有效性的证据,但是不足的试验方法与偏见,尤其是夸大治疗效果。2345偏置设计不良的结果和报告试验可以在各级卫生保健误导决策,为病人制定治疗决策的国家公共卫生政策。

临床试验质量的关键评估可能只有设计、行为,分析相关的彻底和准确地描述在报告中。远不是透明的,相关的报道常常是不完整的,6789复利问题引起的可怜的方法。101112131415

不完整和不准确的报告

许多评论记录缺陷的临床试验报告。例如,信息方法用于试验分配参与者比较组织曾在519年只有21%的试验报告2000年在PubMed索引,16在2006年,只有34%的616份报告索引。17同样,只有45%的试验报告2000年在PubMed索引16和2006年的53%17定义了一个主要终点,只有27%在2000年和2006年的45%报告样本大小的计算。报告不仅是经常不完整但有时也不准确的。119年的报告称,所有与会者都包含在分析的组织最初分配(意向处理分析),15(13%)排除患者或不分析所有患者分配。18许多其他评论发现,报告不足是常见的在专业期刊上1619和期刊发表在除英语之外的其他语言。20.21

适当的随机化减少选择偏倚在试验条目和高品质相关的关键组件。22随机的成功取决于两个步骤:一代的不可预知的分配序列和隐藏这个序列的调查人员招收参与者(见附表1)。223

箱1:治疗分配。随机有什么特别之处?

该方法用于分配干预试验参与者是临床试验设计的一个至关重要的方面。随机分配是首选方法;它已经成功地在实验中经常使用超过50年。24随机有三大优势。25首先,当正确实现,它消除了选择性偏差,平衡这两个已知的和未知的预后因素,分配的治疗。没有随机,治疗比较可能是偏见,无论自觉与否,通过选择参与者的一种特殊接受特别治疗。第二,随机分配许可使用概率论来表达的可能性,任何干预组之间差异的结果只是反映了机会。26第三,随机分配,在某些情况下,促进致盲治疗研究者的身份,参与者和评价者,可能通过使用安慰剂,这样可以减少偏见后分配的治疗。27这三个优势,减少选择偏倚在试验条目通常是最重要的。28

在实践中成功的随机取决于两个相互关联的aspects-adequate代不可预知的分配顺序的序列和隐藏,直到作业发生。223一个关键问题是时间表是否已知或可预见的人参与分配参与者的比较组。29日因此治疗分配制度应该建立这样的人提前入学参与者不知道治疗下一个人会得到,一个过程称为分配隐藏。223合理配置隐藏盾牌的知识即将到来的任务,而适当的随机序列正确预防未来任务的预期基于知识过去的作业。

不幸的是,尽管核心作用、报告的方法通常用于分配参与者的干预措施也不够。例如,5%的206份报告描述的应该在妇产科期刊上相关的研究,并不是真正的随机。23这估计是保守的,因为目前大多数报告不提供足够的信息分配的方法。20.2330.31日3233

相关的改善报告:配偶声明

DerSimonian和他的同事们指出,“编辑器可以大大提高临床试验的报告,为作者提供的项目列表,他们将严格报道。”34在1990年代早期,期刊编辑的两组实验,试验报告的独立方法学家发表建议。3536在随后的社论,兰尼敦促两组,以满足和发展一套共同的建议37;结果是CONSORT声明(合并报告试验标准)。38

CONSORT声明(或配偶)包括一个清单的基本项应该包含在相关的报告和图表记录参与者的流动通过审判。它是主要针对报告相关的两个集团的并行设计。大多数配偶也相关的一类更广泛的试验设计,如non-inferiority等价,阶乘,集群,交叉试验。对配偶的扩展清单报告试验与这些设计已经出版,394041作为报告某些类型的数据(有那些危害42),类型的干预(后备治疗43、中药干预44)和抽象。45

配偶的目的是提供指导,作者对如何改善他们的试验报告。试验报告需要清晰、完整的、透明的。同行评议者,读者和编辑也可以用配偶帮助他们批判性的评价和解释相关的报告。然而,配偶不是作为质量评估工具。相反,配偶的内容集中在项目内部和外部的相关试验的有效性。很多项目没有明确配偶也应该包含在一份报告中提到,如一个伦理委员会批准的信息,从参与者,获得知情同意,相关,存在数据安全监督委员会。此外,提到的任何其他方面的审判应该适当的报道,比如信息相关的成本效益分析。464748

自1996年出版以来,配偶支持超过400种期刊(www.consort-statement.org)和几个编辑组织,如国际医学期刊编辑委员会。49配偶的引入在期刊质量与改善相关的报告。175051然而,配偶是一个持续的计划,和配偶声明是定期修订。3配偶9年前最后一次修订,2001年。525354自那时以来,证据基础告知配偶有了显著的增长;经验数据凸显了新的忧虑关于相关的报告,如选择性报告结果。555657因此配偶组会议召开2007年1月,在加拿大,2001年修改CONSORT声明及其附带的文档的理解和阐述。修改后的清单如表1所示和流程图,没有修改,在图1中525354

表1

配偶2010清单的信息包括当报道一个随机试验

把这个表:

2010年配偶声明:解释和细化

在2001年的配偶修订,显然,解释和精化的CONSORT声明背后的原则将有助于调查人员和其他人写或评价试验报告。配偶的解释和精化58发表在2001年与2001年版的CONSORT声明。它讨论了每个项目的基本原理和科学背景和提供发表好报告的例子。修改那篇文章的基本原理是类似于修改语句,上面所描述的。下面我们简要描述主要添加和删除这个版本的解释和阐述。

配偶2010解释和精化:变化

我们取得了一些实质性的和一些表面的改变这个版本的配偶说明文档(全部细节突出显示在2010年版本的CONSORT声明59)。一些代表配偶清单的变化;有三个新的检查表项的配偶2010 checklist-such 24项,要求作者报告他们的审判协议可以访问。我们也更新了一些现有的解释,包括最近的引用添加到方法论的证据,使用了一些更好的例子。我们已经删除了术语表,现在可以在配偶网站(www.consort-statement.org)。在可能的情况下,我们描述的结果相关的实证研究。许多优秀的书籍的临床试验提供更全面的方法论问题的讨论。6061年62年最后,为了方便起见,我们有时指“治疗”和“病人”,虽然我们认识到,并不是所有的干预措施的评价相关的治疗,并不是所有的参与者都是病人。

清单项目

标题和摘要

1项。识别一个随机试验的标题。

的例子,“吸烟减少口服尼古丁吸入器:双盲,随机临床试验的有效性和安全性。”63年

解释,能够识别一个随机试验的报告电子数据库在很大程度上取决于索引。索引器可能不分类作为一个随机试验报告,如果报告没有明确作者这个信息。64年确保适当的索引,容易识别,研究作者应该使用“随机”这个词在标题表明参与者被随机分配到他们的对比组。

项目1 b。结构化的总结试验设计、方法、结果和结论

具体指导看到配偶抽象。4565年

解释,清澈,透明,足够详细摘要很重要,因为读者经常基地评估这些信息。一些读者使用抽象作为筛查工具决定是否阅读全文。然而,并不是所有的试验都是免费和一些卫生专业人员无法获得完整的试验报告、医疗决策有时是由随机试验的基础上抽象的。66年

期刊文摘应包含足够的信息试验作为精确记录的行为和结果,提供最优的信息中的试验空间约束和日记的格式。写文摘帮助个人正确地构造和快速评估结果的相关性和艾滋病相关报告的检索电子数据库。67年抽象应该准确地反映包括在完整的期刊文章和不应该包括信息没有出现在论文的主体。研究比较信息的准确性在文摘》杂志上报道,报道的文本完整出版发现声称不一致,或失踪,全文的主体。68年69年70年71年相反,从抽象可以省略重要危害严重的误导别人的解释试验结果。4272年

最近扩展CONSORT声明提供了一个基本项目列表,作者应该包括当报道一个随机试验的主要结果日志(或会议)文摘(见表2)。45我们强烈建议使用结构化的抽象随机试验报告。他们为读者提供试验一系列标题下的信息有关的设计、行为,分析和解释。73年一些研究发现,结构化的抽象的更高质量比传统的描述性的抽象74年75年,他们能让读者更容易地找到信息。76年我们认识到,许多期刊已经开发出自己的结构和词限制报告摘要。这不是我们的意图提出这些格式的修改,但是推荐哪些信息应该报道。

表2

项目包括在报告一个随机试验的文摘》杂志上

把这个表:

介绍

项目2。科学背景和基本原理的解释

的例子,“手术是首选的治疗患者的疾病阶段I和II非小细胞肺癌(NSCLC)…一个NSCLC荟萃分析的结果结合八个随机试验的手术和手术+辅助cisplatin-based化疗和显示一个小,但并不显著(p = 0.08),约5%的绝对生存利益在5年(从50%到55%)。当时当前试验设计(1990年代中期),辅助化疗没有成为标准的临床实践…新辅助化疗的临床理由三:回归的主要癌症可以实现从而促进和简化或减少后续手术;未被发现的微转移可能处理的治疗;和假定的刺激可能会有抑制残余癌细胞生长因子释放的手术和后续的伤口愈合…当前审判是因此设置比较,患者可切除的非小细胞肺癌患者,手术仅与三个周期以铂为基础的化疗之后,手术的整体生存、生活质量,病理分期,resectability率,手术范围,时间和复发的网站。”77年

解释,通常,自由流动的介绍包括文本、作者的解释他们的审判的科学背景和原理,和它的大纲。这也可能是适当的,包括试验的目标(见项目2 b)。可能解释的基本原理(例如,评估可能的药物对肾脏功能的影响)或务实的(例如,指导实践通过比较两种疗法的好处和坏处)。作者应该报告任何积极的干预措施的好处和危害的证据包括在试验和应该为干预措施如何建议一个合理的解释工作,如果这是不明显的。78年

赫尔辛基宣言指出,生物医学研究涉及人们应该建立在一个已经具有广泛知识的科学文献。79年也就是说,它是不道德的揭露人类不必要的风险研究。一些临床试验已被证明是不必要的,因为他们解决的问题已经或可能已经回答了现有文献的系统回顾。80年81年因此,需要引入新的试验应该是合理的。理想情况下,它应该包括一个参考系统回顾之前的类似试验报告或缺乏这样的试验。82年

项目2 b。特定的目标或假设

的例子,“在当前的研究中,我们测试的假设主动管理的政策未生育过的工党将:1。降低剖腹产率,2。减少长时间的劳动;3所示。不影响产妇出生满意体验。”83年

解释,目标是试验设计的问题的答案。他们通常与特定的治疗或预防干预的疗效。假设是预先确定的问题被测试来帮助实现目标。比目标更具体的假设并服从明确统计评估。在实践中,目标和假设并不总是很容易区分。大多数的报道相关试验提供足够的信息目标和假设。84年

方法

3项。试验设计的描述(如并行,阶乘)包括分配比例

的例子,“这是一个多中心、分层(6到11年和12到17岁,与不平衡随机[2:1]),双盲,安慰剂对照,与这些相应平行的组织在美国进行的研究(41网站)”。85年

解释,“设计”一词通常是指审判是如何设置的所有方面,但它也有一个窄的解释。许多更广泛的试验设计的特定方面,包括随机和致盲的细节,解决配偶其他地方的清单。我们寻求的信息类型的试验,如平行组或阶乘,和概念框架,如优势或non-inferiority和其他相关问题没有解决其他地方的清单。

单独的CONSORT声明主要关注试验参与者随机两个“平行”组。事实上,几乎超过一半的试验发表这样的设计。16主要的替代设计多臂机平行,交叉,集群,40和阶乘设计。同时,大多数试验将确定一个新的干预的优越性,如果它存在,但其他人则用来评估non-inferiority或等价。39显然是很重要的,研究人员描述了这些方面的试验,包括随机的单位(如病人,医生实践,病变)。理想也包含这些细节抽象(见项目1 b)。

如果一个不太常见的设计工作,鼓励作者解释他们的选择,特别是在这种设计可能意味着需要更大样本大小或更复杂的分析和解释。

尽管大多数试验使用相等的随机两组(比如1:1),它有助于提供显式分配比例。药物试验,试验(I-IV)的指定阶段也可能是相关的。

项目3 b。重要的变化方法试验开始后(如合格标准),与原因

的例子,“病人被随机分配到六个平行组之一,最初1:1:1:1:1:1率,获得的五otamixaban…方案…或依诺肝素的主动控制…一个独立数据监测委员会审查选取患者安全的数据;没有临时分析功效和徒劳。在审判期间,这个委员会建议接受的最低剂量otamixaban (0·035 mg / kg / h)停止因为抗凝不足的临床证据。协议立即依法修改建议,并随后参与者被随机分配在2:2:2:2:1比其余otamixaban和对照组,分别。”86年

解释,几个试验可能会没有任何固定的计划(即完全探索),但大多会有一个协议,指定详细的审判将如何进行。可能会有偏离原来的协议,因为它是无法预测每一个可能的审判过程中变化情况。一些试验因此会有重要的变化在试验开始后的方法。

变化可能是由于外部信息可以从其他研究,或内部财务困难,可能是由于一个令人失望的招聘率。这种协议的变化应在不破坏的致盲积累数据对参与者的结果。在一些试验中,一个独立的数据监测委员会将作为其职责的一部分的可能性,建议协议基于看到选取数据变化。这样的变化可能会影响研究方法(如更改治疗方案,合格标准,随机比例,或随访时间)或审判行为(比如删除中心数据质量较差)。87年

一些试验是建立一个正式的“自适应”的设计。这些设计没有公认的定义,但工作定义可能是“一个多级的研究设计,使用积累的数据来决定如何修改方面的研究没有破坏的有效性和完整性试验。”88年通常的修改样本大小和治疗武器的数量和可能导致决策变得更迅速和更有效的利用资源。然而,重要的伦理、统计和实际问题在考虑这样一个设计。89年90年

修改是否明确试验设计的一部分,或者为了应对不断变化的环境,至关重要的是,他们完全有报道对帮助读者解释结果。改变从协议目前不报道。回顾与协议显示,大约有一半的期刊文章描述相关的有一个无法解释的差异的主要结果。57频繁的无法解释的差异也被观察到随机的细节,致盲,91年和统计分析。92年

4项。合格标准为参与者

的例子,“合格的参与者都是18岁或以上的成人与艾滋病毒达到了合格标准为根据马拉维国家艾滋病抗逆转录病毒疗法治疗指南(临床阶段III或IV或任何阶段与CD4细胞计数< 250 /毫米3)和体重指数为< 18.5开始治疗。排除标准是怀孕和哺乳期或参与另一个补充喂养计划。”93年

解释,合格标准的一个全面的描述用于选择所需的试验参与者是帮助读者解读这项研究。特别是,清楚地了解这些标准的要求来判断谁是为数不多的几个元素应用的实验结果是,审判的generalisability(适用性)和相关临床和公共卫生实践(参见项目21)。94年招聘方法的描述,如转介或自我选择(例如,通过广告),在这种情况下也很重要。因为他们是应用随机之前,合格标准不影响实验的内部效度,但其外部效度的核心内容。

典型的和被广泛接受的选择标准与疾病的性质和阶段研究,排除的人被认为是特别容易受到伤害的干预研究,研究和问题需要确保满足法律和道德规范。知情同意通过研究参与者,例如,通常需要在干预研究。常见的纳入和排除标准之间的区别是不必要的;相同的标准措辞参与者包括或排除。95年

尽管其重要性,合格标准往往不充分报道。例如,试验导致临床警报发布的八个国家卫生研究院指定平均31合格标准的协议,但只有63%的期刊文章中提到的标准,只有19%的人提到的临床警报。96年类似的缺陷被发现艾滋病毒的临床试验。97年在364年手术相关的报道中,25%没有指定任何合格标准。98年

项目4 b。设置和位置数据收集

的例子,“研究发生在抗逆转录病毒治疗诊所的伊丽莎白女王中心医院在布兰太尔,马拉维,从2006年1月到2007年4月。马拉维布兰太尔的主要商业城市人口的1 000 000,估计2004年成人艾滋病毒流行率为27%。”93年

解释,随着参与者的资格标准(见4项)和干预措施的描述(见第五项),设置和位置信息是至关重要的的适用性和generalisability法官审判。参与者招募从小学,中学,还是三级医疗保健和社区的?医疗机构有很大区别在他们的组织、经验和资源的基线风险条件下调查。其他方面的设置(包括社会、经济和文化环境和气候)也会影响研究的外部效度。

作者应该报告的数量和类型设置和描述所涉及的保健提供者。他们应该报告的位置进行了研究,包括国家、城市如果适用,周围环境(例如,社区,办公室练习,医院诊所,或住院单位)。特别是,它应该清楚试验进行了在一个或几个中心(“多中心临床试验中”)。这个描述应该提供足够的信息,以便读者可以判断试验的结果可能会与自己的设置。审判进行可能不同的环境相当的环境试验的结果后,用于指导实践和政策。94年99年作者也应报告任何其他设置和位置信息,可能会影响观察结果,如交通问题,可能影响患者参与或延迟管理干预措施。

第五项。每个组的干预措施有足够的细节来允许复制,包括当他们是如何管理的

的例子,“镇静的患者都接受了第一剂量研究的药物(如口服延长释放美托洛尔匹配100毫克或安慰剂)术前2 - 4 h。研究药物管理局要求50 bpm或者更多的心率和收缩压100毫米汞柱或更高;这些血液动力学之前检查每个管理。在任何时候,如果在第一次手术后6 h,心率是80 bpm和收缩压100毫米汞柱或更高,患者接受他们的第一个术后剂量(延长释放美托洛尔100毫克或安慰剂)匹配口服药。如果研究药物并不是在第一次6 h,患者接受他们的第一个术后剂量在手术后6 h。第一次术后12 h后剂量,患者开始服用口服延长释放美托洛尔每天200毫克或安慰剂30天。如果一个病人的心率一直低于45 bpm或者他们的收缩压低于100毫米汞柱,研究药物保留直到他们的心率和收缩压恢复;研究药物然后重启在100毫克每日一次。患者心率一直45-49 bpm和收缩压超过100毫米汞柱推迟12小时服用研究药物。”One hundred.

“病人被随机分配接受定制的氯丁橡胶夹板晚上穿或常规治疗。夹板是刚性其他矫正法推荐只在夜间使用。它覆盖的拇指和鱼际隆起而不是手腕(图1)。夹板是由3个训练有素的职业治疗师,调整夹板的每个病人,这样第一个网页可以打开了,拇指放在第一长手指的反对。鼓励病人接触职业治疗师如果他们觉得夹板需要调整,疼痛增加戴夹板时,或有不利影响(如皮肤流失)。因为没有治疗可以被认为是黄金标准在这种情况下,控制和干预组患者在接受常规护理的自由裁量权医师(全科医生或风湿病学家)。我们决定不使用安慰剂,因为据我们所知,没有安慰剂夹板疗法取得了成功的致盲的患者,推荐。”101年

解释,作者应该彻底描述每个干预,包括控制干预措施。描述应该允许临床医生想要知道如何使用干预管理的干预试验评估。102年药物干预,信息将包括药物名称、剂量,管理方法(如口服、静脉注射),时间和持续时间的管理、条件干预保留,滴定方案如果适用。如果对照组接受常规治疗”是很重要的描述完全构成。如果对照组和干预组接受干预的结合作者应该提供一个全面的描述每个干预的解释顺序介绍了干预措施的组合或撤回,如果适用和触发器的介绍。

的特定扩展CONSORT声明解决非药理和中药干预措施的报告和他们的特定的报告要求(如技术、细节的干预是标准化)。4344我们建议读者咨询的语句也采用非药物治疗和中药干预。

6项。完全定义预先确定主要和次要结果措施,包括如何以及何时他们评估

的例子,”功效的主要终点对牛皮癣患者的比例达到75%改善牛皮癣活动从基线到12周的帕斯(银屑病面积和严重程度指数)额外的分析都是在帕斯分数和百分比变化改善目标牛皮癣病变。”103年

解释,所有相关的评估响应变量,或结果(终点)的组进行比较。大多数试验都有几个结果,其中一些是比其他人更感兴趣。主要结果测量是预先确定的结果认为是最重要的利益相关方(这样一个病人,决策者、临床医生、资助者)和通常使用的样本量计算(见项目7)。一些试验中可能有一个以上的主要结果。有几个主要的结果,然而,带来的问题解释与多样性的分析(见项目18 - 20),不建议使用。主要的结果应该是明确表示在一个随机对照试验的报告。其他感兴趣的结果是次要的结果(额外的结果)。可能有几次要结果,通常包括意外的或意想不到的影响的干预(见19项),尽管伤害应该被视为重要的是否标明主要或次要的。

所有结果的措施,主要或次要,是否应该被完全识别和定义。这里的原则是提供的信息应足以允许其他人使用相同的结果。102年当评估结果在几个时间点随机后,作者也应该显示的预先确定的时间点主要兴趣。对于许多后备干预指定谁评估结果是有帮助的(例如,如果需要特殊技能)和评估有多少。43

可用的和适当的,之前开发和验证量表的使用或共识指南应该报道,104年105年提高质量的测量和协助相比,类似的研究。106年例如,评估生活质量可能会提高使用仪器进行验证。107年作者应该表明量表的出处和属性。

超过70的结果是196年相关的非甾体抗炎药用于风湿性关节炎,108年和640种不同的工具被使用在精神分裂症2000次试验,其中369只被使用一次。33调查149年2000次试验表明,未发表的尺度是偏见的根源。后备试验中,三分之一的治疗优势基于出版尺度不了如果发布范围内使用。109年类似的数据报告。110年111年519年只有45%的一群相关的出版于2000年指定的主要结果16;相比之下,有53%的614年类似的队列相关的出版于2006年。17

项目6 b。任何更改试验开始后,试验结果与原因

的例子,“最初的主要终点是全因死亡率,但是,在蒙面分析,数据和安全监测委员会指出,总体死亡率低于预期,这项研究不能与样本容量和功率原计划完成。指导委员会因此决定采用co-primary端点的全因死亡率(原主要终点),与全因死亡率或心血管住院(第一个指定二级端点)。”112年

解释,有许多原因偏离最初的研究协议(见24项)。作者应该报告所有主要修改协议,包括计划外更改合格标准、干预,考试,数据收集、方法的分析和结果。这些信息并不总是报道。

如前所示(见6项),大多数试验记录多个结果,结果将报告的风险选择的子集(见17项)。Pre-specification和报告的主要和次要结果(见6项)应该消除这种风险。然而,在一些试验中,环境需要一个评估方式的改变的结果,甚至,在上面的示例中,切换到一个不同的结果。例如,可能有外部的证据来自其他试验或系统的评论暗示终点可能不合适,或招聘或整个事件率试验中可能低于预期。112年改变终点基于选取的数据更有问题的,虽然可能指定的上下文自适应试验设计。88年作者应该识别和解释任何这种变化。同样,试验开始后任何更改名称的结果作为主要或次要应该报道和解释道。

比较102年协议和出版物的随机试验发现,62%的试验报告至少有一个主要的结果是改变,介绍,或者省略与协议。55主要结果之间不同协议和出版物的40%一群48试验由加拿大卫生研究院资助的研究。113年没有一个后续150试验的报告提到,更不用说解释说,变更协议。类似的结果与其他研究已经报道最近在实证研究结果的系统回顾报告的偏见。57

项目7个。样本大小是如何决定的

的例子,“检测减少小灵通(术后住院)的3天5天(SD),在协议Lobo等的研究17双面的5%显著性水平和80%的力量,每组50例的样本大小是必要的,给定一个预期的辍学率为10%。招聘这个包含12个月期的患者数量的预期。”114年

“基于预期的11%的主要复合终点的发生率在安慰剂组2.25年,我们计算出我们需要950主要终点事件和样本量9650例患者给予90%功率检测ivabradine和安慰剂之间的显著差异,相应减少了19%的相对风险(双面1型误差的5%)。我们最初设计的事件驱动的审判,并计划950年主要终点事件发生时停止。然而,主要终点的发病率高于预测,也许是因为招募患者基线特征,人比预期更高的风险(例如,低比例的NYHA类我和较高的糖尿病和高血压)。我们计算,当950年主要终点事件发生,最近包括病人只会治疗了3个月。因此,在2007年1月,执行委员会决定改变被驱动到一个完全时间驱动,项目研究和继续研究,直到病人随机被随访12个月。这种变化并没有改变计划3年时间学习。”115年

解释,科学和道德的原因,试验的样本量需要仔细计划,与医学之间的平衡和统计方面的考虑。理想情况下,一项研究应该足够大,有一个高概率(权力)的检测是一个给定的显著临床重要差异大小如果这样的差异存在。的规模效应被认为重要的是逆相关所需的样本量检测;也就是说,大样本检测微小的差异是必要的。元素的样本量计算每组(1)估计的结果(这意味着临床重要目标区别干预组);(2)α(I型)误差水平;(3)统计力量(或β(II型)错误级别);和(4),连续的结果,测量的标准偏差。116年这些元素的相互作用,他们的报告将为集群不同试验40和non-inferiority等效试验。39

作者应该表明样本大小是如何决定的。如果一个正式的权力使用计算,作者应该确定计算的主要结果(见6项)为依据,所有使用的数量计算,结果每个学习小组目标样本大小。最好报价预期的结果在对照组和群体之间的差异不愿意忽视。或者,作者可以呈现比例的事件或意味着每个小组在他们的计算中使用。细节应给予任何津贴为摩擦或不符合在研究过程中。

一些方法学家写的,所谓的动力不足的试验可能是可接受的,因为他们最终会在系统回顾和荟萃分析相结合,117年118年119年因为一些信息也比没有信息。值得注意的是,重要事项应用这样的审判应该公正,报道,并发表无论结果,从而成为可供荟萃分析。118年另一方面,许多医学研究人员担心动力不足的试验与不确定的结果仍未公布坚称,所有试验应分别有“足够的权力。“这场争论还会继续,和配偶小组的成员有不同的观点。然而,极度辩论和那些观点是无形的试验报告。无论审判的力量,作者需要正确地报告他们的预期大小与所有方法和假设。118年透明地揭示了权力审判的读者,给了他们一个尺度试验评估是否达到其计划规模。

在一些试验中,临时分析用于早期帮助决定是否停止或继续招聘有时超出了计划试验结束(见项目7 b)。如果实际样本大小不同于原先预定的样本量为其他原因(例如,因为可怜的招聘或修订目标样本大小),应给予解释。

与小样本的研究报告通常包括错误的结论,干预组没有差异,而事实上很少有患者研究作出这样的声明。120年一直评论发表的试验发现,高比例的试验低功率检测临床有意义的治疗效果。121年122年123年在现实中,虽小但临床上有意义的真正差异更有可能比大差异存在,但需要大型试验检测。124年

一般来说,在试验报告的样本大小看起来小。样本量中值为54关节炎患者在196年试验,108年46皮肤病患者在73年试验,8和2000年65例试验在精神分裂症。33这些小样本大小是一致的与519年一项研究试验2000年12月在PubMed索引16和类似的试验(n = 616)于2006年在PubMed索引,17招募的患者数量,中位数为平行组试验是80年跨年。此外,许多评论发现,一些作者报告如何确定样本容量。8143233123年

没有绩效的事后计算统计权力使用的实验结果;然后适当的权力由置信区间表示(见17项)。125年

项目7 b。当适用时,解释任何临时的分析和停止准则

的例子,“两个临时分析试验过程中。意义的水平保持一个整体P值为0.05,根据O 'Brien-Fleming停止计算边界。最后分析使用Z分数1.985有一个关联的P值为0.0471。”126年

“一个独立的数据和安全监测委员会定期回顾了有效性和安全性数据。Haybittle-Peto边界停止规则是基于修改4 SD上半年下半年研究和3 SD效果数据,研究和3 SD上半年和下半年2 SD安全数据。两个正式的临时的功效进行分析时主要事件的预期数量的50%和75%应计;没有修正的报告P值执行这些临时测试。”127年

解释,许多试验长期招募参与者。如果一个干预工作特别好或不好,这项研究可能需要结束早期出于伦理方面的原因。这个问题可以被解决通过检查结果的数据积累,最好是由一个独立的数据监测委员会。然而,执行多个统计考试积累数据没有适当的修正可能导致错误的结果和解释。128年如果积累试验数据检查五临时使用P值为0.05的分析,整个假阳性率接近19%比5%的名义。

几组顺序统计方法可以调整多个分析,129年130年131年和他们的使用试验中应预先确定协议。用这些方法,在每个临时数据比较分析,P值小于临界值集团指定的顺序法显示统计学意义。一些实验使用组顺序决策方法作为一个援助,132年而其他人把他们当作一个正式的停止规则(与审判的意图将停止如果观察到的P值小于临界值)。

作者应该报告或数据监测委员会是否服用了多个“看起来”数据,如果是这样,有多少是什么引发了它们,使用的统计方法(包括任何正式停止规则),和他们是否计划在审判开始前,在数据监测委员会看到任何临时数据分配,或者一段时间之后。这些信息通常是不包含在已发表的试验报告,133年试验报告中甚至比原计划提前停止。134年

8项。方法用于生成随机分配序列

的例子,“独立药剂师分发活跃或安慰剂吸入器根据计算机生成随机名单。”63年

”分配的参与者,使用计算机生成的随机数字列表”。135年

解释,试验中参与者应该分配给比较组的基础上一个机会(随机)过程的特点是不可预测性(见框1)。作者应该提供足够的信息,读者可以评估方法用于生成随机分配序列和偏见在任务组的可能性。随机过程是很重要的信息包含在主要文章的主体,而不是作为一个单独的补充文件;会被读者所忽略。

“随机”一词有精确的技术含义。用随机分配,每个参与者都有一个已知的概率接受每个干预前一个分配,但分配的干预是由过程和无法预测的机会。然而,“随机”经常使用不当在文献中描述的非随机试验,确定的分配方法被使用,如交替,医院数字,或出生日期。当调查人员使用这样的非随机方法,他们应该描述精确,不应使用术语“随机”或任何变化。甚至连“拟随机”一词描述这些试验是不可接受的。基于随机试验方法通常产生偏见的结果。234136年偏见可能源自无法掩盖这些分配系统充分(见9项)。

许多序列生成适当的方法。然而,读者无法判断充分性等方面“随机分配”,“随机”或“随机”没有进一步细化。作者应该指定序列生成的方法,如随机数字表或一个计算机化的随机数生成器。生成的序列可能最小化的过程,但一般人都可接受的非随机的方法(见附表2)。

框2:随机和最小化

  • 简单的随机,基于单一纯随机分配比率被称为简单随机。简单用1:1随机分配比例是类似于抛硬币,虽然我们不提倡抛硬币的随机一个随机对照试验。“简单”是有点用词不当。虽然其他随机计划听起来复杂和更复杂的,在现实中,简单的随机复杂优雅,更不可预测和预防超过偏差水平的其他选择。

  • 受限制的随机-任何随机的方法,不是简单的随机。被随机是最常见的形式。限制随机的其他方法包括更换,有偏见的硬币,和urn随机,尽管这些都是使用次数少得多了。141年

  • 被随机-阻塞将生成用于确保比较组根据预定的比率,通常是1:1或组大约相同的大小。阻塞可以用来确保关闭每组的数量平衡在审判期间的任何时候。每一块八个参与者,例如,四是分配给每个部门的审判。142年改善平衡付出的成本减少序列的不可预测性。尽管不同干预措施的顺序随机在每个块中,一个人跑下一个治疗的试验可以推断出一些分配如果他或她知道块大小。143年致盲的干预措施,使用较大的块大小,随机不同的块大小可以改善这个问题。

  • 分层随机-分层是用来确保良好平衡的参与者在每组特征。偶然的机会,尤其是在小型试验,学习小组为基线特征可能没有很好地匹配,如年龄和阶段的疾病。这削弱了试验的可信度。144年这样的失衡可以避免在不牺牲随机的优点。分层确保参与者的数量接收每个干预密切平衡在每个层。分层随机是通过执行一个单独的两个或两个以上的随机过程在每个参与者的子集(例如,这些定义每个研究中心,年龄,或疾病严重程度)。分层的中心在多中心临床试验中很常见。分层需要某种形式的限制(如屏蔽层内)。分层没有阻塞是无效的。

  • 最小化,最小化确保干预组数之间的平衡选择病人因素(如年龄)。2260第一个病人是真正随机分配;对于每一个后续的参与者,最小化的治疗分配不平衡之间的选择的因素组标识。分配可以被使用,或者可以选择随机加权沉重地支持的干预减少不平衡(例如,一个概率为0.8)。使用一个随机组件通常是可取的。最小化的优势使小组密切相似的参与者在试验的所有阶段特征。随机最小化提供唯一可以接受的替代,一些人认为它是优越的。145年另一方面,最小化缺乏理论依据消除偏见在所有已知的和未知的因素。然而,一般来说,使用最小化的试验被认为是方法论上相当于随机试验,即使一个随机元素没有注册。

在一些试验中,参与者是故意不平等的数字中分配的干预:例如,能获得更多的经验与一个新过程或限制试验的成本。在这种情况下,作者应随机率报告(例如,2:1或两个治疗参与者每控制参与者)(见3项)。

代表性的PubMed索引试验在2000年,只有21%的人报告一个适当的随机序列生成方法16;这个增加到34%相似的PubMed索引试验是在2006年。17在90%以上的这些情况下,研究人员使用一个随机数发生器在计算机或一个随机数字表。

项目8 b。类型的随机;任何限制的细节(如阻塞和块大小)

的例子,“随机序列创建使用占据9.0 (StataCorp、大学城、TX)统计软件,由中心分层1:1分配使用随机块大小的2,4,6。”137年

“参与者被随机分配后简单随机化程序(计算机随机数)1 2治疗组。”138年

解释,在数百名参与者或更简单的随机试验通常可以被信任来生成两个审判组织类似的数字139年和生成组大致相似的已知和未知预后变量。140年小型试验(见7项)——即使对于试验不是为了很小,因为它们可能停止在达到他们的目标size-some之前限制随机(程序来帮助实现组织大小或特征)之间的平衡可能是有用的(见附表2)。

重要的是表明是否没有使用限制,这样的陈述或说明“简单随机”。否则,用于限制随机的方法,以及使用的方法随机选择,应该指定。为阻止随机,作者应提供细节块是如何生成的(例如,通过使用交换块设计与计算机随机数生成器),块大小或尺寸,块大小是否固定或随机变化。如果实验开始意识到的块大小(s),这些信息也应报告为这些知识可能导致代码打破。作者应该指定是否分层使用,如果是,涉及哪些因素(如招聘网站、性别、疾病阶段),在地层分类截止值,用于限制和方法。虽然分层是一个有用的技术,特别是对于小型试验,实现起来比较复杂,如果使用了许多作为分层因素可能是不可能的。如果最小化(见附表2),它应该明确标识,作为应变量纳入计划。如果使用一个随机元素应该表示。

206年只有9%的试验在专业期刊上的报告23和39%的80次试验一般医学期刊报道使用分层。32在每种情况下,只有约一半的报告提到的使用限制随机。然而,这些研究和Adetugbo和威廉姆斯8发现治疗组的大小在许多试验是相同或非常相似,但阻止或分层并没有提到。接近平衡的一个可能的解释数字漏报的使用限制随机。

项目9。机制用于实现随机分配序列(如按顺序编号的容器),描述所采取的任何步骤隐藏序列直到干预

的例子,“强力霉素和安慰剂胶囊和相同的外观。他们事先包装瓶和每个女人根据随机编号计划。每个女人都被分配一个订单号和接收相应的预填充的胶囊瓶。”146年

“分配序列是隐蔽的研究员(小)登记和评估参与者按顺序编号,不透明,密封和钉信封。铝箔在信封是用来渲染信封不透水强烈的光。为了防止分配序列的颠覆,参与者的姓名和出生日期写在信封和录像的密封信封与参与者的细节可见。碳纸信封内信息的传递到内部的分配卡信封和第二个研究员(CC)后观看录像带,以确保信封仍然密封在参与者的名字写在他们。相应的信封打开后才登记的参与者完成所有基线评估和是时间分配的干预。”147年

解释,8项讨论一代不可预知的任务序列。相当重要的是这个序列是如何应用当参与者加入到试验(见框1)。生成的分配安排应该实现通过使用分配隐藏,23治疗的关键机制,防止预知任务,从而保护那些招收参与者受到这方面的知识。决定接受或拒绝一个参与者应该,应该从参与者获得知情同意,在无知的序列中的下一个任务。148年

分配隐藏不应混淆致盲(见11项)。分配隐藏旨在防止选择性偏差,保护作业序列直到分配,和总是可以成功地实现。2相比之下,眩目的旨在防止性能和确定偏差,保护分配后的序列,而不能总是执行。23没有足够的分配隐藏,然而,即使是随机的,不可预测的任务序列可以被颠覆。2149年

集中或“第三方”的任务尤其可取的。许多好的分配隐藏机制整合外部介入。使用药店或中央电话随机系统两种常用技术。自动分配系统可能会变得更加常见。150年当外部介入不可行,分配隐藏的极好方法是使用容器编号。干预措施(通常是药物)密封在根据分配序列顺序编号相同的容器。151年封闭作业按顺序编号,不透明,密封的信封是一个很好的分配隐藏机制如果努力开发和监控。这个方法可以破坏,然而,特别是如果它执行得很糟糕。调查人员时应确保信封是不透明的光,打开顺序,只有在参与者的名字和其他细节写在适当的信封。143年

许多方法论的研究提供实证证据支持这些措施。152年153年试验的分配顺序已经不足或约定隐藏了更大的估计治疗效果比试验中,作者称足够分配隐藏。这些发现提供强有力的经验证据,分配隐藏不足导致偏见在评估治疗效果。

尽管分配隐藏机制的重要性,报道常常忽略这些细节。用于分配的干预机制是省略了89%的类风湿关节炎试验报告,108年试验在妇产科期刊的48%,23一般医学期刊和44%的试验。32在一个更广泛的代表性样本的随机试验在PubMed索引,只有18%的人报告任何分配隐藏机制,但是其中的一些报道机制是不够的。16

10项。生成的序列分配,谁登记的参与者,参与者分配给干预谁

的例子,“确定病人是否会被链霉素和躺(S)或单靠躺(C)是由引用统计系列基于随机抽样数量制定每个性由布拉德福德希尔教授在每个中心;系列的细节被未知的任何调查或协调员…接受病人的面板后,在进入链霉素中心之前,适当的编号信封打开在中央办公室;里面的卡片告诉如果病人是一个年代或C,然后这个信息是给中心的医务官。”24

“分配组的详细信息中包含有彩色卡片上按顺序编号,不透明,密封的信封。这些都是准备在NPEU和保存在一个商定的位置在每个病房。随机发生的第二阶段的劳动力时,助产士认为阴道分娩即将来临。进入一个女人走进书房,助产士打开下一个信封编号。”154年

“随机块是由计算机生成的随机数字表由一名调查员没有参与临床试验。我们通过入学的分层肿瘤相关的过程。在研究护士得到病人的同意,她打电话给一个联系人是谁独立招聘过程的分配货物。”155年

解释,正如9项提到的,隐蔽的分配干预招生的时候尤其重要。因此,除了知道方法,同样重要的是要理解随机序列是如何来实施的,谁赚分配顺序,谁登记的参与者,谁分配参与者审判组织。

随机试验参与者在试验过程中有三个不同的步骤:序列生成、分配隐藏,和实现(见附表3)。虽然同样的人可能执行多个进程在每个标题下,调查人员应该为之奋斗的完全分离的人参与生成和分配隐藏从参与任务的实现。因此,如果有人参与序列生成或分配隐藏步骤,理想的情况是他们不应该参与实现的步骤。

盒3:在一个典型的随机过程的步骤

序列生成
  • 生成一些随机分配序列的过程

分配隐藏
  • 开发分配隐藏机制(如编号、相同的瓶子或按顺序编号,密封,不透明信封)

  • 准备分配隐藏机制使用分配序列的生成步骤序列

实现
  • 报名参与者:

    • 评估资格

    • 讨论了试验

    • 获得知情同意

    • 报名参与试验

  • 确定干预的任务(比如打开下一个信封)

  • 管理干预

即使完美的序列生成和分配隐藏,未能独立创建和分配序列的隐藏任务研究小组可能会引入偏见。例如,生成一个分配序列的人可以保留一个副本,咨询的时候面试潜在参与者的审判。因此,人可以偏见招生或作业过程中,无论任务序列的不可预知性。调查人员必须确保作业计划是不可预测和锁(例如一个保险箱在一栋建筑,而无法进入到报名地点)甚至从生成它的人。报告的调查人员的审判应该指定存储分配列表。

11项。如果做,蒙蔽后分配的干预(例如,参与者,保健提供者,这些评估结果)和方式

的例子,“而分配给干预组病人和医生意识到手臂,分配结果评估和数据分析师一直蒙蔽分配。”156年

“致盲和平衡是严格维护通过强调饮食干预工作人员和参与者,每个坚持健康的原则,并且每个某些专家所倡导的是优越的长期减肥。除了干涉(营养师和行为心理学家),调查人员和员工都忽视饮食分配的参与者。审判坚持建立程序维护人员之间的分离,测量结果和员工提供干预。员工获得的测量结果并不明智的饮食集团的任务。干预人员、营养师和行为心理学家发表的干预并没有把测量结果。所有人员,员工,和参与者一直蒙面的测量结果和试验结果。”157年

解释,术语“致盲”或“掩蔽”是指隐瞒信息分配的干预从参与审判的人可能受到这方面的知识。致盲是一个重要的防止偏见,尤其是主观评估的结果。153年

本杰明·富兰克林被认为是第一个使用致盲的科学实验。158年他被蒙上眼睛的参与者,所以他们不会知道,当他被运用催眠术(18世纪流行的“治疗液”),这样做表明催眠术是一个骗局。根据这个实验,科学界认可致盲减少偏见的力量,它仍然是一个在科学实验常用的策略。

框4,眩目的术语,定义了个人的组织(参与者,卫生保健提供者,数据收集器,结果退休审核人员,和数据分析师)谁都可能引入偏差试验通过治疗任务的知识。参与者可能有不同的反应,如果他们意识到自己的治疗任务(如响应更积极接受治疗时)。153年炫目的缺乏也会影响遵守干预,使用co-interventions,退出试验的风险。

选取医疗服务提供者可能会引入类似的偏见,选取数据收集器可能不同评估结果(如频率或时间),重复测量的异常发现,在性能测试或提供鼓励。选取结果退休审核人员可能不同主观评估结果,选取数据分析师可能会引入偏见通过分析策略的选择,比如选择有利的时间点或结果,决定删除患者从分析。这些偏见已经有据可查的。71年153年159年160年161年162年

致盲,与分配隐藏(见10项),可能并不总是适当的或可能的。一个例子是一个审判的疼痛程度比较与抽样血液从ear或拇指。163年致盲当结果措施涉及一些主观性尤为重要,如评估疼痛。炫目的数据收集器和结果退休审核人员不太可能对客观结果,如因任何原因死亡。即便如此,然而,缺乏参与者或医疗服务提供者致盲会导致其它问题,比如微分磨损。164年在特定的试验,尤其是手术试验,炫目的参与者和外科医生通常是困难的或不可能的,但炫目的数据收集器和结果退休审核人员往往是可以实现的。例如,病变可以拍摄之前和之后的治疗和评估外部观察者。165年无论致盲是可能的,作者可以和应该国家失明(参与者,卫生保健提供者,数据收集器,和结果退休审核人员)。

不幸的是,作者常常不报告是否使用致盲。166年例如,506年的报道,51%的试验在囊性纤维化,167年33%的类风湿关节炎,196次试验108年在皮肤科和38%的68次试验8没有状态是否使用致盲。直到致盲试验改善报告的作者,读者将难以判断的有效性试验中,他们可能希望使用指导临床实践。

屏蔽这个词有时用于偏好致盲,以避免混乱的医疗条件是没有看到。然而,“致盲”似乎在其方法论意义上理解世界并为临床试验报告是可以接受的。165年168年

箱4:眩目的术语

为了让一个技术术语工具必须有它的使用和解释的一致性。作者的试验通常使用术语“双盲”,一般较少,术语“单盲”或“三重盲目。”A problem with this lexicon is that there is great variability in clinician interpretations and epidemiological textbook definitions of these terms.169年此外,200相关的报道,双盲的研究发现18个不同组的组合其实蒙蔽了这些试验的作者调查时,大约每五个实验报道双blind-did不是盲目的参与者,卫生保健提供者,或者数据收集器。170年

这项研究表明,条件是模糊的,因此,作者和编辑应该放弃使用。作者应该明确报告的致盲地位人士来说,眩目的可能影响试验的有效性。

卫生保健提供者包括所有人员(例如,医师、按摩师、物理治疗师、护士)谁照顾参与者在试验。数据收集器收集数据对审判结果的个体。结果退休审核人员确定参与者的个体体验感兴趣的结果。

一些研究者也提倡致盲和报告的眩目的状态数据监测委员会和作家的手稿。160年这些团体并不常见致盲,炫目的价值争论。171年

有时一群个体(如医疗服务提供者)同一个人完成另一个角色在试验(如数据收集器)。即使是这种情况,作者应该明确国家这些团体的眩目的地位让读者判断试验的有效性。

项11 b。如果相关,描述相似的干预措施

的例子,“杰米逊实验室公司提供500毫克立即释放烟酸在白色,长圆形,平分囊片。我们使用高效液相色谱法独立消息来源的证实囊片内容…安慰剂是匹配研究药物味道,颜色,大小,和包含微晶纤维素,二氧化硅,磷酸氢钙,硬脂酸镁,硬脂酸。”172年

解释,就像我们寻找隐藏的证据向我们保证,任务是真正随机的,我们寻求的证据致盲的方法。炫目的试验参与者或卫生保健提供者,作者应该国家干预的特点的相似性(如外观、味道、气味和方法管理)。35173年

有些人主张测试致盲通过要求参与者或卫生保健提供者的审判是否他们认为参与者收到实验干预或控制。174年因为参与者和卫生保健提供者通常会知道参与者经历了主要结果,这使得很难确定他们的反应反映致盲的失败或精确的假设干预的疗效。175年考虑到不确定性提供这种类型的信息,我们已经删除了倡导报告这种类型的测试致盲的配偶2010声明。然而,我们主张作者报告任何已知的妥协在致盲。例如,作者应该报告是否有必要截断符号参与者在审判的行为在任何时候。

12项。统计方法用于比较组为主要和次要的结果

的例子,“主要终点是体重的变化在20周的研究意向处理人口…次要疗效端点包括腰围的变化,收缩压和舒张压,代谢综合征患病率…我们使用协方差分析(ANCOVA)为主要终点和次要终点腰围、血压、patient-reported结果分数;这是辅以重复测量分析。ANCOVA模型包括治疗、国家和性别作为固定效应,和体重随机作为协变量。我们旨在评估数据是否提供的证据的优越性每个liraglutide剂量安慰剂(主要目标)和奥利司他(二级目标)”。176年

解释,数据可以分析在很多方面,其中一些可能不是严格意义上的适当的在一个特定的情况下。有必要指定哪个统计程序被用于每个分析,并进一步澄清的结果可能是必要的部分报告。遵循的原则是,“描述统计方法与足够的细节,使一个知识渊博的读者访问原始数据来验证报告的结果”(www.icmje.org)。同样重要的是描述统计分析的细节如意向处理分析(见附表6)。

几乎所有的方法分析产量估计治疗效果,这是一个比较组之间的对比结果。作者应该陪这个置信区间估计的效果,这表明中央范围的不确定性对于真正的治疗效果。置信区间可能解释为治疗效果的范围值与观测数据兼容。是习惯目前的95%置信区间,使范围将包括100年的真正价值在95年类似的研究。

研究结果也可以评估的统计学意义。P值代表了观测数据的概率(或一个更极端的结果)可能会出现偶然当干预没有真正有所不同。实际P值(例如,P = 0.003)强烈的不精确的阈值报告,比如P < 0.05。48177年

标准分析方法假定数据是“独立的。”For controlled trials, this usually means that there is one observation per participant. Treating multiple observations from one participant as independent data is a serious error; such data are produced when outcomes can be measured on different parts of the body, as in dentistry or rheumatology. Data analysis should be based on counting each participant once178年179年或者应该是通过使用更复杂的统计过程。180年错误分析的多个观测每个是123年(63%)的196次试验在类风湿性关节炎。108年

项目12 b。额外的分析方法,如子群分析和调整分析

的例子,“病人的比例反应比较治疗组之间Mantel-Haenszelχ2测试,为分层变量调整后,甲氨蝶呤使用。”103年

“预先确定子群分析根据赋值(s)抗氧化治疗,存在与否的心血管疾病之前,膳食摄入叶酸,吸烟,糖尿病,阿司匹林,激素疗法,和维生素使用使用分层Cox比例风险模型进行。这些分析基线风险评估和使用受到限制参与者在基线常数子组数据。”181年

解释,主要分析一样,亚组分析的方法应明确指定。分析最强的是那些寻找证据的治疗效果差异互补的子组(例如,年长和年轻的参与者),称为交互测试比较。182年183年共同但误导的方法是比较P值分别分析每组的治疗效果。是错误的推断子群的影响(交互)一个重要和非重要P值。184年这样的推论有较高的假阳性率。

因为虚假的结果,风险高子群分析往往气馁。14185年事后组比较(分析完成后查看数据)尤其不可能被进一步的研究证实。这种分析没有伟大的可信度。

在一些研究中,调整失衡的参与者特征通过使用某种形式的多元回归分析。虽然需要调整相关的流行病学研究要少得多,调整分析可能是明智的,特别是如果一个或多个变量被认为是预后。186年理想情况下,调整分析应该在研究方案中指定(参见24项)。例如,调整经常推荐给任何分层变量(见项目8 b)在分析战略应遵循的原则设计。在相关的,决定调整不应由基线差异是否显著(见16项)。183年187年任何调整的基本原理分析和应指定使用的统计方法。

作者应该明确的选择变量调整后,指示如何处理连续变量,并指定分析是否计划或建议的数据。188年评论发表的研究表明,调整分析报告是关于这些方面的不足。188年189年190年191年

结果

13项。参与者流(图是强烈推荐)

13项。为每个组,参与者被随机分配的数量,收到预期的治疗,主要结果进行了分析

的例子,参见无花果2和3

">Figure2

图2流程图的多中心试验部分流动储备与血管摄影指导经皮冠状动脉介入(PCI)(改编自托尼诺et al313年)。图中包括详细信息排除参与者。

">图3

图3医疗管理流程图的最小的手术而慢性gastro-oesophageal返流性疾病(改编自格兰特et al196年)。图中显示了一个多中心试验平行non-randomised偏好组。

解释,的设计和开展一些相关的简单,和参与者的流动,尤其是随访没有损失或排除,通过每个阶段的研究可以充分描述几句话。在更复杂的研究,读者可能难以辨别是否以及为什么有些参与者分配没有接受治疗,失访,或被排除在分析之外。51这些信息是至关重要的几个理由。参与者被排除在外后分配不太可能代表所有参与这项研究。例如,患者不得用于后续评估,因为他们经历了治疗急性加重的疾病或伤害。22192年

摩擦损失的结果跟进,这通常是不可避免的,需要区别investigator-determined排斥等原因不合宜,退出治疗,和穷人坚持试用协议。错误的结论可以达到如果参与者被排除在分析,群体之间的这种遗漏和失衡可能特别的偏见的说明。192年193年194年信息调查人员是否包含在所有参与者进行了随机分析,在组织他们最初分配(意向处理分析(见16箱6)项),因此尤为重要。了解参与者的数量没有收到分配的干预或没有完成治疗允许读者评估何种程度的估计疗效治疗可能低估了与理想条件下相比。

如果可用,评估资格的人数也应报告。虽然这个数字仅与外部效度相关,可以说是比另一个更重要,195年它是一个有用的指标,试验参与者是否可能代表所有合格的参与者。

回顾相关的发表在领先五将军和内科医学期刊1998年发现报告的参与者往往是不完整的,特别是关于参与者收到的数量分配的干预和失访。51甚至信息作为基本的参与者的数量进行了随机和没有排除在分析数量多达20%的文章。51报告是更彻底的文章,包括图流的参与者通过试验,推荐了配偶。本研究通知修改流程图的设计在修改后的CONSORT声明。525354建议模板是图1所示所需的数量,详细描述在表3

表3

信息文档流的参与者通过每个阶段所需的随机试验

把这个表:

一些信息,比如个人评估资格的数量,可能并不总是知道,14根据试验的性质,有些方面可能会比其他人更相关。它有时会是有用的或必要的结构流程图适应特定的试验。在某些情况下,其他信息可能有效地补充道。例如,平行的流程图组试验的最小的手术相比,医疗管理慢性gastro-oesophageal回流还包括一个平行non-randomised偏好组(见图3)。196年

的具体形式和内容流程图可以根据不同的具体特性试验。例如,许多试验手术或疫苗接种不包括中断的可能性。虽然配偶强烈建议使用这个图形设备通信流在整个研究中,参与者没有具体规定的格式。

项目13 b。为每个组,随机损失和排除后,在一起的原因

的例子,“只有一个协议偏差,研究小组在一个女人。她有一个异常骨盆测量和原定了选择性剖腹产。然而,参加产科医生判断劳动力接受审判;剖腹产是在没有完成第一阶段的进展的劳动。”197年

“九个中心的监控导致戒断,存在的一些病人不能证明,或其他严重违反良好的临床实践发生。”198年

解释,一些协议偏差可能报道流程图(见13项)——例如,参与者没有收到预期的干预。如果参与者排除后随机(相反意向处理原则),因为他们被发现不符合资格标准(见16项),他们应该包含在流程图中。使用术语“协议偏差”发表文章不足以证明随机后排除的参与者。协议的性质后偏差和确切的原因不包括参与者随机应该报道。

14项。日期定义招聘和后续的时期

的例子,“Age-eligible参与者招募了…1993年2月到1994年9月…参与者参加诊所访问时随机(基线),每隔6个月3年。”199年

解释,知道什么时候发生,在一项研究期间受试者招募地方历史背景的研究。医疗和手术治疗,包括并发疗法,不断演进和可能影响日常保健给参与者在试验。知道参与者招募的速度也可能是有用的,尤其是对其他调查人员。

后续的长度并不总是后定期随机。在许多相关的事件的结果是时间,后续所有的参与者在一个特定的日期结束。这个日期应该,也是有用的报告最低,最大,平均随访时间。200年201年

回顾报告在肿瘤学期刊上,用生存分析,其中大多数是不相关的,201年132份报告发现,近80%(104)包括权责发生制的开始和结束日期的病人,但只有24%的132份报告(32)也报道的日期跟踪结束。

项目14 b。为什么审判结束后还是停止

的例子,”时的临时分析,总随访包括估计总数的63%的白细胞数量已经收集了在研究结束时,导致阈值为0.0095,是由Lan-DeMets alpha-spending函数法…临时分析,RR 0.37在干预组与对照组相比,p值为0.00073,低于阈值。数据和安全监测委员会建议研究者中断试验和提供包皮环切术,对照组,他们接着问来调查中心,MC割礼(医疗)建议和提议…因为这项研究是中断,一些参与者没有完整随访的日期,和他们尚未完成的访问被描述为“计划”在本文中。”202年

”2000年1月,疫苗供应问题需要全国临时更换整个细胞组成部分结合DPT / Hib疫苗百日咳疫苗。这种疫苗概要文件有不同的局部不良反应,我们决定提前停止审判。”203年

解释,可以说,实验后临时分析任意进行计划外事件积累很少使用没有统计准则运行风险高的数据在一个随机的极端“捕捉”,这可能代表着一个庞大的高估的治疗效益。204年

读者可能会画较弱的推论的审判截断数据驱动的方式与一个报告其调查结果达到一个目标后独立的结果。因此,相关的应该显示为什么审判结束(见附表5)。该报告还应披露外在因素影响的试验决定停止试验,并决定停止试验,包括报告的作用资助机构在审议和决定停止试验。134年

系统回顾143年相关停止比原计划提前停止后发现,这些试验报告说好处积累值66事件,估计平均相对风险为0.47事件的数量应计和强大的关系和作用的大小,用更少的事件产生较小的试验最大的治疗效果(优势比31日95%置信区间12到82)。134年虽然越来越多的试验发表在高影响医学期刊报告提前停止,只有0.1%的试验报道停止早受益,与估计引起的仿真研究205年和调查的数据安全监督委员会。206年因此,许多试验积累一些参与者和报告大治疗效果可能比原计划提前停止了这个动作,但未能报告。

箱5:早期停止

相关的可以结束时样本量达到他们的目标,他们的事件计数目标,跟踪目标的长度,或者当他们到达预定关闭日期。在这些情况下的审判将会停止的方式独立于它的结果,和停止是不可能引入偏见的结果。另外,相关的可以比原计划提前停止,因为临时分析的结果显示大于预期利益或损害实验干预。相关也可以比原计划提前停止当调查人员发现的证据没有重要区别实验和控制干预措施(即停止了徒劳)。此外,试验可能停止早期因为审判变得不可行:资金消失,研究人员无法获得符合条件的患者或研究干预措施,或其他研究的结果使研究问题无关紧要。

完整的报告为什么审判结束了对基于证据的决策很重要(参见条目14 b)。研究者检查为什么143次试验停止早期发现许多未能受益报告关键方法学信息决定停止是如何达到样本量(n = 28)计划,临时分析之后,这次审判是停止(n = 45),或者停止规则是否明智的决定(n = 48)。134年7 b项清单需要临时的报告时间分析,引发了他们什么,有多少,这些攻击是否计划或临时,是否有统计先验指南和停止规则。此外,它有助于知道一个独立的数据监测委员会参与分析(和谁组成,特别注意资金来源)的作用,他们决定停止。通常数据安全和监视委员会提出建议和资助者(赞助商)或研究人员决定停止。

试验停止原因显然早期独立的试验结果,达到计划终止试验,不可能介绍偏差的停止。207年在这些情况下,作者应该临时分析报告是否发生,这些结果是否可用的资助者。

推动试验改变干预应对中期业绩,从而使快速发展的更快的评价有前途的干预和致命的条件,需要更加谨慎的报告过程和早期决定停止试验。208年

15项。一个表显示每组基线人口统计学和临床特点

的例子,见表4

表4

报告基线人口统计学和临床特点的例子。表1 *(改编自Yusuf et al209年)

把这个表:

解释,虽然合格标准(见4项)指出谁是合格的试验,同样重要的是要知道参与者的特征实际上是包括在内。这个信息让读者,尤其是临床医生判断相关试验的结果可能是个别病人。

随机试验的目的是比较不同组的参与者只有对干预(治疗)。虽然适当的随机分配防止选择性偏差,它并不保证组在基线是等价的。任何基线特征的差异,然而,机会的结果,而不是偏见。32学习小组应该比较重要的基线人口统计学和临床特点,以便读者可以评估他们是多么相似。基线数据尤其有价值的结果,也可以测量的试验(如血压)。

基准信息最有效地在一个表(见表4)。连续的变量,比如体重、血压,数据应该报道的可变性,以及平均值。连续变量可以总结为每个组的平均值和标准偏差。当连续数据有一个不对称分布,最好的方法可能是报价中值和百分位数范围(第25和第75百分位数等)。177年标准误差和置信区间不适合描述variability-they推论而不是描述性的统计数据。少量的有序分类变量(如第四阶段的疾病我)不应被视为连续变量;相反,数字和比例应该为每个类别报道。48177年

不幸的是意义的测试基线差异仍然是常见的2332210年;他们报告在一半的50 1997年发表在领先的通用期刊上的相关试验。183年这种意义测试评估的概率观察基线差异可能是偶然因素;然而,我们已经知道,任何差异造成的机会。测试基线差异不一定是错的,是不合逻辑的。211年这样的假设检验是多余的,可以误导调查人员和读者。相反,比较的基线应基于考虑预后变量测量和强度大小的任何失衡发生的机会。211年

16项。为每个组,数量的参与者(分母)包含在每个分析和分析是否由原始分配组

的例子,“所涉及的主要是意向处理分析和所有的患者被随机分配。”212年

“一个病人alendronate组是输给了跟进;因此数据从31日患者可用的意向处理分析。五个病人被认为是协议违反…因此26患者仍按方案分析。”213年

解释,每组参与者的数量是一个重要的元素的分析。虽然流程图(见13项)可能表明参与者的数量分析,这些数据经常变化不同的结果的措施。参与者的数量每组应给予分析。二进制的结果,(如风险率和风险差异)分母或事件率也应报告。表达结果分数也能帮助读者在评估是否随机分配的参与者被排除在分析之外。此前,结果不应仅仅总结措施,如相对风险。

参与者可能有时得不到完整的干预,或一些不合格的患者可能是随机分配的错误。一个广泛推荐处理此类问题的方法是分析所有参与者根据原来的小组作业,不管后来发生什么(见附表6)。这种“意向处理”策略并不总是简单的实现。是常见的一些病人没有完成一个研究可能辍学或退出积极治疗,因此未被评估。如果结果是死亡率,这类病人可能被包括在分析基于注册信息,而归责技术可能需要使用是否其他结果数据丢失。“意向处理分析”一词通常是开水不当的例子,当那些没有收到第一个剂量的试验药物被排除在分析之外。18

相反,分析只能局限于参与者履行协议的资格、干预措施和结果评估。这种分析被称为一个“治疗”或“协议”分析。不包括参与者的分析可能导致错误的结论。例如,在一个试验,将医学与外科治疗颈动脉狭窄,仅限于参与者可用于后续分析显示,手术短暂性缺血性发作的风险降低,中风和死亡。然而,意向处理分析基于所有参与者最初分配没有显示一个优越的手术效果。214年

意向处理分析通常青睐,因为它能避免偏见的随机损失有关的参与者。215年216年217年无论作者使用术语“意向处理”,他们应该明确和有多少参与者包括在每个分析(见13项)。不符合指定的治疗可能意味着意向处理分析低估了治疗的潜在好处,和额外的分析,如每个协议分析,可能会因此被认为是。218年219年然而,值得注意的是,这种分析往往是明显的缺陷。220年

403年回顾相关的发表在2002年的10个主要医学期刊,249年(62%)报告的使用意向处理分析的主要分析。这个比例是高期刊坚持CONSORT声明(70%v48%)。文章中报道的使用意向处理分析中,只有39%实际分析所有参与者随机,有超过60%的文章在其主要缺失的数据分析。221年其他研究显示类似的结果。18222年223年试验报告没有排除方法论上较弱的在其他方面比那些报告排除一些参与者,173年强烈表明至少某些研究人员排除参与者不报告。另一项研究发现,报告意向性治疗分析与良好的研究设计和报告的其他方面,如描述样本大小的计算。224年

箱6:意向处理分析

个随机对照试验的特殊力量是避免偏见当分配的干预试验参与者(见附表1)。这一优势允许强大的推断因果关系与其他研究设计不合理。为了保持完全随机的巨大的利益我们应该包括所有参与者随机分析,保留所有的组中分配。这两个条件定义一个“意向处理分析,广泛推荐的首选分析策略。18223年意向处理分析对应分析完全按照随机分组。严格的意向处理分析往往是难以实现的两个主要reasons-missing结果试验参与者和没有遵守协议。

丢失的结局

许多实验排除患者没有观察到的结果。通常这是合理的,但是一旦任何随机参与者被排除在分析不是严格意向性治疗分析。事实上,大多数随机试验有失踪的观察。实验有效地省略参与者没有最终结果数据之间必须选择改动或者他们失踪的结果数据。225年“完成情况”(或“可用”)分析只包括那些结果是已知的。尽管一些缺失的结果不会导致一个问题,在一半的试验中10%以上的随机患者可能缺失的结果。226年这种常见的方法将失去权力通过减少样本大小,和偏见可能是如果被失访患者对治疗的反应有关。应该有担忧当频率或辍学的原因干预组之间的差异。

参与者与失踪的结果只能包含在分析如果他们的结果估算(也就是说,他们的结果估计从其他信息收集)。归责的缺失数据允许分析符合意向处理分析但是需要很强的假设,这可能是很难证明的。227年简单的归责方法是吸引人,但它们的使用可能是不明智的。特别地,一种广泛使用的方法是“最后的观察结转”缺失的最后结果变量的值被之前的最后一个已知值取代参与者失去了跟进。通过它的简单这是吸引人的,但该方法可能会引入偏见,228年也没有考虑不确定性的污名。229年许多作家严重批评去年观察发扬光大。229年230年231年

没有遵守协议

另一个问题是,审判协议之后可能没有完全试验参与者。常见的例子是参与者不符合入选标准(如错误的诊断,太年轻),收到了被禁co-intervention,并没有把所有的治疗,或者接受了一个不同的治疗或没有干预。简单的方法来处理任何协议偏差是忽略它们:所有的参与者都可以包含在分析无论坚持协议,这是意向处理方法。因此,排除任何参与者等原因不符合意向处理分析。

“修改意向处理”这个词很广泛用于描述分析,排除了那些不充分遵守协议,特别是那些没有接受干预最少的定义。232年另一个词是“每一个协议。”Though a per protocol analysis may be appropriate in some settings, it should be properly labelled as a non-randomised, observational comparison. Any exclusion of patients from the analysis compromises the randomisation and may lead to bias in the results.

“意向处理”,这些其他标签可靠地澄清哪些患者包括在内。因此,在配偶清单我们减少了意向处理分析的具体要求,以明确的描述完全包含在每个分析。

17项。对于每个主要和次要的结果,为每组结果,估计效果及其精度(如95%置信区间)

的例子,见表5和6

表5

例子每个研究小组的报告汇总结果(二进制的结果)。表2 *(改编自Mease et al103年)

把这个表:
表6

例子每个研究小组的报告汇总结果(连续的结果)。(改编自范Linschoten表3234年)

把这个表:

解释,对于每一个结果,研究结果应报告为每组的总结的结果(例如,数量的参与者有或没有事件和分母,或测量的平均值和标准偏差),连同之间的对比组,称为效应大小。二进制的结果,效果可能是风险率(相对风险),比值比,或风险的区别;生存时间数据,风险比或平均存活时间差异;和连续的数据,它通常是不同的意思。置信区间应该呈现的对比组。一个常见的错误是单独的置信区间的演示结果在每组而不是治疗的效果。233年试验结果往往更清楚地显示在一个表,而不是在文本,如表5所示和6

所有的结果,作者应该提供一个置信区间来表示(不确定性)的估计精度。48235年95%置信区间是传统的,但偶尔会使用其他级别。许多期刊要求或强烈鼓励使用置信区间。236年他们尤其有价值差异之间的关系,不符合传统的统计学意义,因为他们经常表明,结果并不排除一个重要的临床差异。置信区间的使用明显增加了近年来,虽然不是医学专业。233年虽然P值可能提供除了置信区间,结果不应仅仅作为P值报告。237年238年结果应该报道计划主要和次要终点,不仅对统计学意义或“有趣的分析。“选择性报告研究中是一个普遍而严重的问题。5557在试验中临时分析,解释应该关注最终结果在审判结束时,不是中期业绩。239年

二进制和生存时间数据,表达结果还数量需要治疗的好处可以帮助或伤害(见项目21)。240年241年

项17 b。二进制的结果,表示建议的绝对和相对效应的大小

的例子,“氧依赖或死亡的风险降低了16% (95% CI 25%到7%)。绝对差−6.3% (95% CI−−2.7% 9.9%);早期政府估计16婴儿因此防止1婴儿死亡或长期依赖氧气”(也参见表7所示)。242年

表7

报告绝对和相对效应值的例子。表3(改编自奥西里斯的协作组织242年)

把这个表:

解释,当主要的结果是二进制,相对效应(风险比(相对风险)或优势比)和绝对效应(风险差异)应该报道(置信区间),作为相对测量和绝对测量仅给出了一个完整的影响及其意义。不同的观众可能更喜欢相对或绝对风险,但是医生和人们倾向于高估效应提出了相对风险。243年244年245年风险的大小差别不大generalisable其他人群的相对风险,因为它依赖于基线风险未曝光的集团,往往不同的人口。结果是常见疾病,附近的相对风险统一可能表明临床上重要的公共卫生方面的差异。相比之下,一个大相对风险时,结果是罕见的可能并不那么重要对公共卫生(尽管它可能是重要的个体在高风险类别)。

18项。执行的任何其他分析结果,包括子群分析和调整分析,区分从探索性预先确定

的例子,”的基础上的一项研究表明围手术期β-blocker功效可能会随基线风险,我们预定的主要亚组分析的基础上,修订后的心脏风险指数评分系统。我们也做了预定的二级子群分析基于性别、手术类型,并使用硬膜外或脊髓麻醉。为所有子群分析,我们使用Cox比例风险模型,结合测试交互,指定在p < 0.05…重要的图3显示了我们的指定子群分析的结果和显示的一致性效果…我们的子群分析动力不足检测子群的适度的差异影响,检测是否有一个真正的子群效应”。One hundred.

解释,相同数据的多个分析创建一个假阳性结果的风险。246年作者应该抵制诱惑,执行许多子群分析。183年185年247年分析指定的试验协议(见项目24)更可靠的比建议的数据,因此作者应该报告分析判断。如果进行亚组分析,作者应该报告子组检查,为什么,如果他们预定的,又有多少被指定。子群的选择性报告分析可能导致偏见。248年当评估一个小组问题不在于小组展示了一个具有统计学意义的结果,但亚组治疗效果是否显著不同。为了确定这一点,测试交互是有益的,虽然这种测试通常是低的权力。如果正式评估交互进行(见项目12 b)他们应该报告为每个子群的干预效应的估计差异(置信区间),不仅仅是P值。

在一项调查中,35 50试验报告包括子群分析,其中只有42%的人使用交互的测试。183年往往是很难确定子群分析中指定的协议。手术的另一个调查试验中期刊发表高影响,72年的27日试验报告54子群分析,其中91%是事后和只有6%的亚组分析用的交互测试评估子群效应是否存在。249年

类似的建议适用于调整为基准变量的分析。如果完成,未经调整和调整分析应该报道。作者应该表明是否调整分析,包括变量的选择调整,计划。理想情况下,试验协议应该状态是否为指定基线调整变量使用协方差分析。187年调整为变量,因为他们在基线显著差异可能偏差估计的治疗效果。187年一项调查发现,不被承认的协议和出版物之间的差异被发现所有25个试验报告子群分析和23 28试验报告分析调整。92年

项目19。每组中所有重要的危害或意想不到的效果

具体指导看到配偶伤害。42

的例子,“病人经历的比例之间的任何不利事件是类似rBPI21(杀菌/ permeability-increasing重组蛋白)和安慰剂组:168(88.4%)的203年190年和180年(88.7%),分别是患者低rBPI21比接受安慰剂11 12身体系统…患者出现严重不良事件的比例,根据调查,低数值rBPI21组比安慰剂组:53个(27.9%)的190年和74年(36.5%)的203名患者,分别。只有三个严重不良事件报告为毒品,他们都发生在安慰剂组。”250年

解释,读者需要的信息危害以及干预的好处做出理性和平衡决策。的存在和性质不良反应可以产生重大影响是否一个特定的干预将被视为可接受的和有用的。不是所有报道不良事件观察试验期间必然是干预的结果;一些可能的条件接受治疗的结果。随机试验提供最好的方法以及疗效数据提供安全数据,尽管他们不能发现罕见的伤害。

许多相关的报告提供不良事件信息不足。192年的一项调查显示从1967年到1999年公布的药品试验显示,只有39%的人足够的临床不良事件报告和29%有足够的实验室报告定义的毒性。72年最近,比较之间的不良事件数据提交给美国国家癌症研究所的试验数据库,赞助试验,在期刊文章和信息报告发现,低品位不良事件被低估了在期刊文章。优质事件(常见毒性标准等级3 - 5)在文章、报道的不一致和信息关于归因试验性药物是不完整的。251年此外,回顾试验6个一般医学期刊发表在2006年至2007年发现,尽管89%的133份报告不良事件所提到的,没有严重不良事件信息和撤回病人因不良事件有27%和48%的文章,分别。252年

CONSORT声明的扩展提供了详细建议伤害随机化试验的报告。42建议和例子适当的报告从配偶免费网站(www.consort-statement.org)。他们补充的配偶2010声明,应该咨询,尤其是危害的研究是一个重要的目标。简而言之,如果数据收集不良事件,事件应该和定义,列出关于标准化在适当的地方标准。数据收集和使用的方法应该描述事件的归因。为每一个研究部门每个不良事件的绝对风险,为重复事件使用适当的指标,参与者的数量由于危害应该提出撤回。最后,作者应该提供一个平衡的讨论的好处和坏处。42

讨论

20项。试验的局限性,解决潜在的偏见的来源,不精确,如果相关,多重性的分析

的例子,“男性患者(85%)的优势是我们的研究的局限性…我们使用裸金属支架,因为药物洗脱支架在权责发生制直到晚期才可用。尽管后者可能被视作一个限制因素,公布的数据显示没有好处(无论是短期或长期的)对死亡和心肌梗死在稳定的冠状动脉疾病患者接受药物洗脱支架,与那些接受裸金属支架相比。”253年

解释,科学报告的讨论往往充满言论支持作者的发现254年并提供小的测量参数研究的利弊及其结果。一些期刊试图解决这一问题,鼓励更多的结构,作者讨论的结果。255年256年例如,内科医学年鉴建议作者结构呈现的讨论(1)的概述关键的发现,(2)考虑可能的机制和解释,(3)比较与其他相关研究成果已发表的研究(只要有可能包括系统回顾结合当前研究的结果与之前的所有相关研究的结果),(4)本研究的局限性(和方法用于最小化和弥补这些限制),和(5)做一个简要的介绍,总结了临床和研究意义的工作。255年我们建议作者遵循这些明智的建议,也许还在讨论部分使用合适的副标题。

尽管讨论限制经常省略了研究报告,257年识别和讨论研究有特别重要的弱点。258年例如,一个外科小组报道,腹腔镜胆囊切除术,技术上困难的过程,显著降低并发症率比传统的开放管理急性胆囊炎胆囊切除术。259年然而,作者没有讨论一个明显的偏见的结果。研究人员已完成腹腔镜胆囊切除术,而80%的胆囊切除术已经完成学员开放。

作者还应该讨论任何的不精确的结果。可能出现不精确的几个方面的研究,包括测量的主要结果(见第6项)或诊断(见4项)。也许使用的规模是验证一个成年人,但用于儿科,或评估员不是如何训练的管理工具。

之间的差异统计学意义和临床重要性应该承担。作者应该特别避免常见的错误的解读与结果表明等效的干预措施。置信区间(见项17)提供了有价值的洞察审判结果是否符合临床重要的效应,无论P值。120年

作者评估时要特别注意与多个对比试验的结果。这样多样性来自几个干预,结果措施,时间点,子群分析,和其他因素。在这种情况下,一些统计上显著的发现可能会带来机会。

项21。Generalisability(外部有效性、适用性)的试验结果

的例子,”作为干预是实现男女,各个年龄段,各种类型的运动,在不同级别的运动,结果表明,整个范围的运动员,从年轻精英中间和娱乐高级运动员,将受益于使用提出培训计划预防复发的脚踝扭伤。通过包括当中未治疗和医学治疗的运动员,我们涵盖了广泛的损伤程度。这表明,目前的培训计划可以实现所有运动员的治疗。此外,因为它是合理的假设踝关节扭伤无关与体育运动相媲美,该计划可能会从中受益。”260年

“这复制和延伸克拉克和他的同事们的工作表明,CB(认知行为)预防计划可以可靠地、有效地在不同的设置由临床医生以外的人最初的干预。影响大小与先前的报道是一致的,单,表明抑郁预防研究和健壮的跨站点对抑郁症和症状…在这个generalisability审判,我们选择比较条件相关的公共health-usual保健…样本也以工薪阶层为主的中产阶级提供医疗保险。给定证据表明CB治疗的青少年可以更有效的收入高的家庭,这将是重要的测试这个预防计划的影响更经济和民族多元化样本。”261年

解释,也叫做generalisability或适用性,外部效度的研究结果可以普遍的其他情形。262年内部效度,在多大程度上设计并进行审判的消除偏见的可能性,是外部有效性的先决条件:一个有缺陷的试验的结果是无效的,其外部效度的问题变得无关紧要。没有绝对的外部效度;这个词有意义的只是关于明确指定的条件,没有直接的检查试验。结果可以全面个体参与者或组,不同于那些参与试验对年龄、性别、疾病严重程度,和共病情况?结果适用于其他药物的类内相似的药物,不同的剂量,时间,和给药途径,和不同的疗法吗?类似的结果可以预期在小学,中学,和三级水平的护理?如何对相关结果的影响并不是评估试验中,和后续治疗和持续时间长度的重要性,尤其是对危害?263年

外部有效性的判断,取决于参与者的特征包括在试验,试验设置,治疗方案的测试和结果评估。5136年因此,关键是足够的信息被描述对合格标准和设置和位置(见项目4 b)的干预措施和它们是如何管理(见第五项),结果(见第6项)的定义,和招聘和随访期间(见14项)。对照组的参与者的比例的结果发展风险(对照组)也很重要。合格的参与者拒绝的比例进入试验流程图(见项目13)上所注明的相关generalisability的审判,因为它可能表明偏好或干预的可接受性。类似的考虑可以申请临床医生的偏好。264年265年

几个问题是重要的实验结果应用于个别病人。266年267年268年虽然有些变化治疗反应个体病人和病人之间在审判或系统评价是预期,差异往往是在大小而不是方向。

虽然有重要的例外,268年治疗(尤其是药物269年发现在一个狭窄的范围是有益的的病人通常有更广泛的应用于实践。框架提出了外部效度的评估,包括定性研究,比如在积分“过程评价”270年和清单。271年措施纳入基线风险计算治疗效果时,如治疗所需的数量来获得一个额外的有利的结果,需要将生产一个不利影响,有利于评估benefit-to-risk平衡个体病人或一组特征不同于典型的试验参与者。268年272年273年最后,经过推导病人集中估计的潜在益处和害处的干预,临床医生必须将它们集成对治疗病人的价值观和偏好。同样的考虑当评估结果的generalisability不同的设置和干预措施。

22项。解释与结果一致,平衡利益和损害,并考虑其他相关证据

的例子,1990年以前发表研究报告”表明预防性免疫疗法也减少院内感染very-low-birth-weight婴儿。然而,这些研究了少量的病人;采用不同的设计,准备,和剂量;,包括不同的研究群体。在这个大型多中心、随机对照试验,反复静脉注射免疫球蛋白预防管理未能显著降低院内感染的发生率在早产儿出生时重501 - 1500克。”274年

解释,读者想知道目前的试验的结果与其他相关的。这最好可以通过包括一个正式的系统评价报告的结果和讨论部分。83年275年276年277年这样的审判作者合成可能是不切实际的,但通常可以引用一个系统回顾类似的试验。系统回顾可以帮助读者评估个随机对照试验的结果是否与其他相似的试验在相同的话题,并且在研究参与者是否相似。相关的报道往往没有充分处理这些点。277年贝叶斯方法可以用来统计结合试验数据与先前的证据。278年

我们建议,至少,讨论应该尽可能系统,是基于一个全面的搜索,而不是局限于研究支持当前试验的结果。279年

其他信息

23项。注册登记号码和名字的审判

的例子,“审判是在ClinicalTrials.gov登记号码NCT00244842。”280年

解释,干脆不整个试验的结果,281年282年选择性报告结果的试验中,每个协议而非意向处理分析已经被很好地记录下来了。5556283年秘密冗余发表的临床试验也会导致问题,特别是对于作者的评论来自同一试验结果时无意中包含不止一次。188bet手机版188bet手机版284年

减少或避免这些问题有重复调用过去25年注册临床试验在《盗梦空间》,将独特的试验识别号码,和其他记录基本信息公开审判这至关重要的细节。285年286年287年288年最近严重的问题引发的预提数据,289年有了新的努力注册随机试验。事实上,世界卫生组织指出,“登记所有介入试验是一种科学、伦理和道德责任”(www.who.int ictrp / en)。通过注册一个随机试验,作者通常报告一组最少的信息和获得一个独特的试验注册号码。

2004年9月国际医学期刊编辑委员会(ICMJE)改变了政策,说他们会考虑试验发表只有已注册入学前的第一个参与者。290年这导致大幅增加数量的试验被注册。291年接受注册(ICMJE给予指导www.icmje.org/faq.pdf)。

在165年最近的一项调查高影响因子医学期刊的作者,44期刊特别指出,所有最近的临床试验必须注册为杂志的要求提交。292年

作者应该提供的名称注册和审判独特的注册号。如果作者没有登记他们的审判应该显式地声明并给出原因。

24项。可以访问完整的试用协议,如果可用吗

的例子,“审判的全部细节协议补充附录,可以找到与这篇文章的全文www.nejm.org。”293年

解释,完成试验协议(而不是一个特定过程在一个试验)的协议很重要,因为它pre-specifies随机试验的方法,如主要结果(见6项)。有一个协议可以帮助限制未申报事后更改的可能性试验方法和选择性报告结果(见项目6 b)。可能是重要的元素包含在一个随机试验的协议描述。294年

有几个选项供作者考虑确保他们的审判协议是有兴趣的读者188bet手机版188bet手机版可访问。在上面的示例中,所述期刊报道可以使试验的主要试验结果协议可以在他们的网站。可访问性试验结果和协议是增强开放获取期刊时。188滚球软件一些期刊(如试用)发布试验方案,出版时可以引用报告试验的主要结果。试验注册(见项目23)也将确保有许多试验协议细节,作为最低试验特性包括在批准试验注册数据库包括几个协议项目和结果(www.who.int ictrp / en)。审判人员也可以张贴他们的审判协议在网站上通过他们的雇主。无论使用何种机制,我们鼓励所有的审判人员协议方便有兴趣的读者。

25项。资金来源和其他支持(如药物)的供应,资助者的角色

的例子,收到“拨款支持的干预计划国际和研究来自威康信托基金会和联合国艾滋病规划署。投资者没有参与研究设计、数据收集和分析,决定发表,或准备手稿。”295年

“这项研究是由葛兰素史克制药。葛兰素史克公司参与的设计,进行研究和试验期间提供后勤支持。赞助商与调查人员合作的员工准备统计分析计划,但由犹他大学的分析。手稿是由Shaddy博士和指导委员会成员。葛兰素史克公司被允许检查手稿并建议更改,但最终决定内容被作者只保留。”296年

解释,作者应该对试验报告的资金来源,因为这是读者评估试验的重要信息。研究表明,制药行业赞助的研究更有可能产生的结果有利于产品由公司赞助的研究比其他研究资助的来源。297年298年299年300年系统回顾30研究资金资助的一项研究发现,制药行业有四倍的几率比研究成果有利于赞助由其他来源(优势比为4.05,95%可信区间2.98到5.51)。297年目前大部分试验出版物不报告的资金来源。漏报是难以量化的程度。370个药品试验的调查发现,29%未能报告的资金来源。301年在PubMed的另一个调查中,索引随机试验发表在2000年12月,据报道66%的519的资金来源试验。16

参与水平的资助者和他们的影响设计,试验不同的行为,分析和报告。因此重要的是,作者详细描述资助者的角色。如果资助者没有这样的参与,所以作者应该状态。同样,作者应报告任何其他来源的支持,如药物的供应和制备或设备,或在数据分析和写作的手稿。302年

相关的报告,没有两组平行设计

友推荐的重点与并行设计和相关的两个治疗组。最相关的设计,但大量少数民族不:45%(233/519)的相关发表在2000年12月,162006年12月,39% (242/616)。17

大部分的CONSORT声明适用于所有试验的设计,但是有一些额外的问题解决为每个设计。之前出版的2001年修订的CONSORT声明,配偶小组决定开发扩展的主要CONSORT声明相关的特定的试验设计。扩展相关已发表报告集群随机试验40和non-inferiority等效试验。39缺乏资源意味着其他扩展计划尚未完成;他们将用以下设计:覆盖试验multiarm平行,阶乘,交叉,within-person。

作者报告试验与集群设计或使用non-inferiority或等效框架应该咨询配偶除了这些建议在这个文档。这里我们做一些临时评论其他设计。在每种情况下,试验设计应明确表示,在这两个主要的文字和文章的文摘。

Multiarm(> 2组)平行组试验至少需要修改标准的配偶指导。流程图可以很容易扩展。两组的主要区别试验与澄清的研究假设与多个组,和随之而来的数据分析和解释的方法。析因试验,之间的交互干预的可能性通常需要考虑。除了总体比较参与者做了或没有收到每个干预研究,调查人员还应考虑报告结果为每个治疗组合。303年

在交叉试验,每个参与者收到两个(或更多)治疗以随机的顺序。主要的额外问题解决与配对性质的数据,影响设计和分析。304年类似的问题影响within-person比较,参与者同时收到两个治疗(通常是成对的器官)。另外,因为时间或系统性的风险延滞效应,分别在这两种情况下的选择设计需要理由。

配偶集团打算发布扩展配偶涵盖所有这些设计。此外,我们将发布现有指南的更新集群随机试验和non-inferiority和等效试验考虑的重大更新通用配偶指导。

讨论

评估医疗干预措施可能会误导人,除非调查人员确保公正的比较。随机分配学习小组仍是唯一的方法,消除了选择和混杂的偏见。Non-randomised试验往往会导致估计治疗效果比随机试验。305年306年

偏见危害甚至是相关的,但是,如果调查人员进行此类试验不当。307年最近的系统回顾,聚合结果的几个方法论的调查,发现,主观的结果,试验使用不充分或不清楚分配隐藏收益率为31%的估计效果比那些使用适当的隐藏,和试验没有蒙蔽了大25%的估计。153年正如所预期的那样,两者之间有一个强大的协会。

个随机对照试验的设计和实现需要方法论以及临床专业知识,一丝不苟的工作,143年308年和高度的警觉性不曾预料到的困难。相关的报道应该用同样密切关注减少偏见。读者不应该猜测;方法应该完整和透明的,所以读者可以很容易区分试验与公正的结果从这些有问题的结果。合理的科学包含足够的报告和道德审判的行为取决于声音的基础科学。309年

我们希望这更新的配偶解释文章将协助作者使用2010版本的配偶和解释方面的重要性充分的试验报告。CONSORT声明可以帮助研究人员在未来设计试验310年并能指导同行评议者和编辑手稿的评价。事实上,我们鼓励同行评议者和编辑使用配偶的清单评估作者是否已经报道了这些项目。这样的评估可能会提高出版的清晰度和透明度试验。因为配偶是一个进化的文档,它需要持续评估的动态过程,细化,,如果有必要,改变,这就是为什么我们有这个清单和说明文章的更新。作为新证据和批判性评论积累,我们将评估未来更新的必要性。

CONSORT声明的第一个版本,从1996年开始,似乎已经导致改善报告的相关期刊的质量,采用了它。5051525354。其他组织使用配偶模板来提高其他研究报告的设计,如诊断测试311年和观察性研究。312年

配偶的网站(www.consort-statement.org)建立了提供教育材料和材料相关的存储库数据库相关的报告。这个网站包括很多真实试验的例子,包括在本文中所有的例子包括。我们将继续向数据库添加好的和坏的报告的例子,我们邀请读者进一步提交建议通过网站联系我们。配偶集团将继续调查文献找到相关文章,解决相关问题相关的报告,我们邀请任何此类文章的作者来通知我们。所有这些信息将通过配偶访问的网站,定期更新。

超过400领先通用和专业期刊和生物医学编辑组织,包括国际、世界医学期刊编辑协会和科学委员会编辑,他们配偶的官方支持。我们邀请其他期刊关注临床试验报告的质量支持CONSORT声明,通过我们的网站联系我们,让我们知道他们的支持。这些集体努力的最终受益者应该是人,不管出于什么原因,需要来自社区医疗干预。

笔记

引用这个:BMJ2010;340:c869

脚注

  • 我们感谢弗兰克大卫杜夫和汤姆朗参与2001年版本的配偶的解释和细化文档。特别感谢玛丽奥坎波,渥太华的配偶协调员,协助提供这纸和配偶语句的理解和阐述。

  • 配偶组贡献者的配偶2010:道格拉斯·G奥特曼在医学中心的统计数据,牛津大学,英国;弗吉尼亚巴伯,《公共科学图书馆·医学》杂志上英国;杰西柏林,强生制药研发、美国;伊莎贝尔Boutron,巴黎大学7丹尼斯•狄德罗援助Publique des Hopitaux巴黎,由法国;加拿大麦克马斯特大学PJ审视;凯Dickersin,约翰霍普金斯大学彭博公共卫生学院的美国;戴安娜Elbourne,伦敦卫生与热带医学学院的英国;苏珊•Ellenberg宾夕法尼亚大学医学院的美国;Val Gebski、悉尼大学、澳大利亚;史蒂文•古德曼学会杂志》上的临床试验美国;彼得·C Gøtzsche北欧科克伦中心、丹麦;崔西园,BMJ英国;史蒂文•格伦伯格美国临床肿瘤学会、美国;加拿大麦克马斯特大学的布莱恩·海恩斯,;莎莉霍普韦尔,在医学中心的统计数据,牛津大学,英国;阿斯特丽德·詹姆斯,《柳叶刀》;美国强生彼得Juhn;菲利帕米德尔顿,阿德莱德大学,澳大利亚;美国加州大学欧文分校不Minckler;大卫·莫赫渥太华方法中心、临床流行病学项目,渥太华医院研究所,加拿大;维克多·M Montori知识和遇到的研究单位,梅奥临床医学院,美国;辛西娅·Mulrow内科医学年鉴美国;斯图尔特可以排除,伦敦卫生与热带医学学院的英国;德拉蒙德兰尼,《美国医学会杂志》美国;大卫·L Schriger急诊医学年鉴美国;美国家庭健康国际肯尼斯·舒尔茨F;个中知己赤道网络,英国;英国的伊丽莎白打赌,侧面图。

  • 资金:我们感激地承认金融支持来自英国国家健康研究所;加拿大卫生研究院的研究;总统基金,加拿大卫生研究院的研究;强生(Johnson & Johnson);BMJ;美国临床肿瘤学会。

  • 为了鼓励传播2010年的配偶声明,本文是自由访问bmj.com,也将发表的临床流行病学杂志。本文作者联合举办的版权。用于进一步的细节,请参见配偶网站(www.consort-statement.org)。

这是一个开放分布式根据条创作共用署名非商业性的许可证,允许使用,分布,在任何介质,和繁殖提供了最初的工作是正确地引用,使用非商业,否则按照许可证。看到的:http://creativecommons.org/licenses/by-nc/2.0/http://creativecommons.org/licenses/by-nc/2.0/legalcode

引用

视图抽象