适合医疗保健专业人员

教育和辩论

计算结果是某一事件发生时间的试验所需的治疗数量

BMJ1999319doi:https://doi.org/10.1136/bmj.319.7223.1492(1999年12月4日出版)引用这个:BMJ319:1492 1999;
  1. 道格拉斯·G奥特曼他是医学统计学教授d.altman在{}icrf.icnet.uk一个
  2. 每Kragh安徒生他是生物统计学教授b
  1. 一个帝国癌症研究小组医学统计小组,医学统计中心,健康科学研究所,牛津海丁顿,OX3 7LF
  2. b哥本哈根大学生物统计学系,DK-2200哥本哈根N,丹麦
  1. 通信:通信:D G Altman
  • 接受1999年7月5日

需要治疗以防止再次发生事件的患者人数(需要治疗的人数;NNT)已成为一种广泛使用的衡量治疗受益的指标,该指标来源于具有二元结果的随机对照试验的结果12我们展示了如何获得治疗研究所需的数字,其中主要结果是事件的时间。我们主要考虑无法获得原始数据的情况,例如,在审查已发表的研究时,以及在获得原始数据时如何继续进行。

总结分

需要治疗的人数是需要治疗的患者的人数,以防止一个额外的不良结果

这个数字(带置信区间)是临床报告对照试验结果的有用方法

对于任何报道二元结果的试验,需要治疗的数量可以作为患者比例的绝对差异与感兴趣的结果的倒数

在研究中,结果的兴趣是事件发生的时间,计算可以扩展到显示在治疗开始后的任何时间需要治疗的数量

事件数据时间

如前所述,对于二元结果的研究,需要治疗的数量将根据随访时间长短而变化。3.对于生存的研究来说,这种与时间的关系更为明确。需要治疗的人数并不单一;而是可以在治疗开始后的任何时间点进行计算。通常有一个或两个临床感兴趣的时间点。

治疗所需的特定时间数量表示需要给予所讨论的治疗的患者数量,以使额外的患者存活到那个时间点,即从治疗中获益。为了获得与置信区间一起处理所需的数量的估计值,需要下列条件之一:(一)每个组在一个固定时间点的生存概率的估计,以及在那个时间点“处于危险”的患者数量,即尚未经历兴趣事件或生存概率的标准误差;或(b)不幸的是,在生存研究中,对结果的报道往往是不充分的,4而所需的信息往往得不到提供。

方法和例子

我们假设有两个治疗组。计算与随访期开始后(即治疗开始后)固定时间点的生存概率有关。我们考虑三种情况

只有存活概率可用

假设,首先,只进行了简单的生存分析,生成了Kaplan-Meier生存曲线。我们将积极治疗组和对照组在选定时间点的估计生存概率表示为S一个和Sc并假定活性药物是有效的,因此S一个>年代c.绝对风险降低估计为S一个−年代c.如果有必要,年代一个和Sc可以通过仔细测量Kaplan-Meier生存曲线图来估计,需要处理的数量简单地得到1/(S一个−年代c),就像用二进制数据进行试验一样。

绝对风险降低(ARR)的95%置信区间为ARR±1.96 SE(ARR),其中SE(ARR)为绝对风险降低的标准误差。如果这个置信区间的极限是Al和一个u,则需要处理的数量的95%置信区间为1/Au1 /一个l

当没有给出绝对风险降低的标准误差和置信区间时,有三种选择:

  1. 如果S的置信区间一个和Sc时,每个标准误差可取为相关置信区间宽度的四分之一

  2. 如果S一个和Sc,则SE(ARR)可计算为√{[SE(S一个)]2+ (SE (Sc)]2

  3. 如果没有给出标准误差或置信区间,我们需要在估计的概率对应的时间内仍处于危险(存活)的患者数量,我们将其称为n一个和nc.这些数字有时会显示在生存图表中;如果没有,就必须进行推断。如果没有什么损失可以跟进,那么风险数字将接近S一个N一个和ScNc,其中N一个和Nc数字是随机分配到每一组的。然而,关于后续损失的信息往往是缺失的。4绝对风险降低的标准误差为√[S]一个2(1−年代一个)/ n一个+ Sc2(1−年代c) nc,其95%置信区间如上所示。如果上述计算都不可能,则无法获得所需处理的数字的置信区间。


嵌入式图像

(来源:苏SHARPLES)

例子

总体而言,279例局部进展期直肠癌患者随机接受放疗后进行手术,与单纯手术进行比较。5样本量的计算是基于3年的生存期。从图2本文中两组患者的3年生存率分别为62.2%和46.8%,存活患者分别为59人和43人。由上式可知,ARR=0.622−0.468=0.154,SE(ARR)=√[0.622]2(1−0.622)/ 59 + 0.4682(1−0.468)/43]=0.072,给出绝对风险降低的95%置信区间为0.013至0.295。因此,3年治疗所需的人数为1/0.154=6.49,其95%置信区间为1/0.295到1/0.013,即3.4到77.6。因此,我们估计手术前给予患者放射治疗,每治疗6.5名患者,3年就会增加1名幸存者。然而,置信区间非常宽。

当治疗效果没有统计学意义(P>0.05)时,绝对风险降低的95%置信区间为零,需要治疗的人数的置信区间为负。在这种情况下,与绝对风险降低相反的通常被称为危害所需数量(NNH)。6然而,更准确的是指治疗有益所需的数量(NNTB)或治疗有害所需的数量(NNTH)。7通过在合适的值上绘制绝对风险降低值并重新标记坐标轴,可以避免绘制置信区间的困难,7如下图所示。

可用的生存概率和估计的危险比

风险比更像是相对风险而不是优势比,4但与相对风险不同。习惯的分析方法假设,在治疗开始后,这一比率始终是相同的

log rank检验提供了在每组中观察到的和预期的事件数量。危险度估计为积极组和对照组中观察到的人数与预期人数之比。如果治疗是有益的,危险比将小于1。不幸的是,很少有作者提供从这个分析中观察到的和预期的数字。

风险比更多的是通过Cox回归得到的,Cox回归在对照试验中用于调整试验结果的其他预后变量。这里处理的回归系数(通常表示为b或β)是对数风险比。由此可知,风险比估计为eb.回归系数(b)或风险比(h=e .b)可能在已发表的论文中引用。

如在某一特定时间,t,对照组的存活概率为Sc(t)则活动组存活概率为[Sc(t))h,其中h为各治疗组比较的风险比。需要处理的数量估计为:NTT=1/{[Sc(t))h年代c(t)}(方程1)

在年代c(t)是通过上述方法之一获得的。患者可能不需要的数量(h的信息整合到标准错误)。注意,h和治疗所需的数量可能依赖于其他变量都包含在回归模型和它们是如何编码的,虽然在一个随机试验的差异应该小。

需要处理的数的95%置信区间由方程1得到,方法是依次用h的95%置信区间的两个极限替换h。如果没有明确给出,可以从回归系数b得到值(回想一下h=e)b),其标准误差为eb - 1.96 - se (b)和eb + 1.96 se (b).由此产生的置信区间可能太窄,因为它忽略了S估计的不精确性c(t).如果我们有回归分析的结果,但没有任何对对照组生存概率S的估计,我们稍后再回到这个问题c(t),我们无法估计需要治疗的人数。

例子

我们使用了一项随机试验的数据,对糖尿病和急性心肌梗死患者进行强化胰岛素治疗和标准胰岛素治疗的比较。8从图1对照组2年和4年死亡率分别为0.33和0.49。报告的危险比为h=0.72, 95%可信区间为0.55 ~ 0.92。因此,两年治疗所需的人数估计为1/(0.330.72需要处理的数字的95%置信区间由方程1得到,将h设为0.55,然后设为0.92,得到4.7至32.7。

原始数据可用

对于报告试验结果的研究人员来说,所有的原始数据都是可用的。显然可以使用任何上述方法计算数量需要治疗,调整或调整,所有提到的统计数据可以轻松地生成我们也可以扩展方法很简单生成一个图显示数量需要治疗作为时间的函数,而不是一个单一的时间点。

例子

172名非小细胞肺癌患者随机接受单独放疗或联合化疗。1原始数据(随访时间稍长)由Piantadosi提供。10数字1显示了两组无病生存的Kaplan-Meier曲线,而表格显示了估计需要治疗的人数,有95%的置信区间。

164例非小细胞肺癌患者接受放射治疗加化疗vs单独放疗后不同时间需要治疗的数量9

把这个表:
">图2所示。
图2所示。

164例非小细胞肺癌患者接受放疗+化疗vs单独放疗治疗后的获益或伤害所需的治疗数量,其95%置信区间为治疗以来的时间9,这是基于Cox回归模型(包括仅治疗)得出的

这个表是基于两个治疗组的简单比较,可以产生调整的生存曲线,通常通过Cox回归,来调整各种基线变量的治疗比较。治疗所需的数量也可以从这些调整的分析中得到,再次使用方程1。图中显示了一个例子2.如此处所示,如果治疗效果具有统计学意义(P<0.05),则需要治疗的数量的95%置信区间将始终排除有害影响。

尽管模型假设两种治疗方法比较的风险比(相对风险)是恒定的,但重要的是要认识到,对于预后不同的患者亚群,需要治疗的人数是不同的。构造类似figure的图可能是有价值的2对于重要的患者子集,例如在示例中按阶段或细胞类型。

讨论

越来越多的人认识到,对影响进行绝对和相对衡量的必要性。2治疗所需的数量最近成为了一种相当流行的报告临床试验结果的方式。1治疗所需的数量通常会倾向于下降的时间从开始治疗增加Sackett等人提出了一个简单的修正跟进的长度,在观察到的数量需要治疗的比例乘以实际平均随访时间感兴趣的持续时间。3.这种计算假设治疗的效果(相对风险降低)随时间的推移是恒定的,事件的发生率随时间的推移是恒定的。在这些强大的假设需要治疗,说,6来源于一项研究中,患者平均随访2年意味着很多需要治疗3如果患者随访4年之后这种方法,米勒提出了几个试验数量每年需要治疗,计算方法为需要治疗的总人数乘以平均随访时间。11

当记录感兴趣的事件的实际时间时,需要处理的数字可以作为后续时间的函数得到。对于许多已发表的论文来说,可以使用这些方法来获得需要处理的数字,也许还可以根据其他变量进行调整。这一方法对于那些为二次发表的期刊进行论文评审的人来说是有价值的,需要处理的论文数量按一个或两个特定的时间点计算。

置信区间的数量需要治疗的基础上考克斯模型可能太窄(“保守”),因为该方法忽略了不确定性的估计生存概率的置信区间获得这一缺陷适用于治疗所需的数量来自日志优势比估计从逻辑回归模型。在描述从已发表的论文中给出的信息所需要处理的数字时,没有办法绕过这个问题。从原始数据中可以得到无偏的置信区间,但是方法比较复杂,我们在这里没有给出。

需要治疗的数量是有价值的额外信息,可以在随机试验报告中提供,其中感兴趣的结果是事件发生的时间。我们已经展示了如何用几种方法计算这些研究所需的治疗数量。一般来说,最好是直接进行这样的计算,而不是做出风险降低在后续时间内是常数的强烈假设。

脚注

  • 资金丹麦流行病学服务中心的活动得到丹麦国家研究基金会的赠款的支持。

  • 相互竞争的利益没有宣布。

参考文献

  1. 1.
  2. 2.
  3. 3.
  4. 4.
  5. 5.
  6. 6.
  7. 7.
  8. 8.
  9. 9.
  10. 10.
  11. 11.
视图抽象