大量的临床研究正在开展,包括病人的数据,观察性研究,临床试验和那些基于实验室分析的审计。虽然小规模的研究可以在很短的时限内发布,需要有那些可以快速进行和那些应该基于多个目标,因此可能需要数年时间才能完成之间的平衡。本文章提供了与小型研究相关的主要考虑因素的概述。
“小”有多小?
“小”的定义取决于主要的学习目标。当简单地描述一组受试者的特征时,例如吸烟的流行程度,研究规模越大,结果就越可靠。主要结果应该有95%的置信区间(CI),这些置信区间的宽度直接取决于样本量:大型研究产生的区间较窄,因此结果更精确。例如,一项有20个研究对象的研究,对于大多数调查来说可能规模太小。例如,假设一个特定的20个人的群体中吸烟者的比例是25%。相关的95% CI是9-49。这意味着这些受试者的真实患病率通常介于低值或高值之间,这不是一个有用的结果。
当比较两个或更多个组的受试者之间的特性(例如研究的规模取决于预期效应的大小,通常用相对风险、优势比、绝对风险差、危险比或两种方法或中间值之间的差异来量化。真实效应的规模越小,研究需要的规模就越大1,2。这是因为它是比较困难的一个真正的效果和随机变异区分。考虑死亡率在比较药物A和每组100名受试者安慰剂试验终点。如果1年死亡率是药物有15%,而安慰剂组20%,风险差异为5%,但这仅代表五连药A.死亡减少这是不容易确定这种差异是否是由于新药物或只是偶然的行动。有可能只是碰巧在一组少5人死亡。但是,如果死亡率分别为5与40%,这代表了100名受试者接受药物A中35只更少的死亡,这是不太可能的所有是由于机会。因此,每手100例患者试用过小,如果预期差值为5%,但足够大,如果预期差值为35%。Figure 1⇓说明研究规模如何影响,可以得出的结论。
的优势
少数受试者参与的研究可以快速开展患者登记、患者记录复查、生化分析或要求受试者完成研究问卷。因此,一个明显的优势是研究问题可以在相对较短的时间内得到解决。此外,小型研究往往只需要在几个中心进行。与大型的多中心研究相比,小型研究更容易获得伦理和机构批准。国际研究尤其如此。
它往往是更好地在少数受试者的第一测试一个新的研究假设。这避免花费过多的资源,例如科目,时间和财务成本,找到一个因素和疾病之间的关联时,实在是没有效果。但是,如果一个协会发现它,使之在的结论,这是从假设生成研究,需要更大的验证性研究清楚是很重要的。
小规模的研究还可以使用的替代指标的检验协会时,即可以使用的,而不是一个真正的结局指标,但它可能不会有明显的影响,受试者能够识别的一个因素。例如,在肺癌,在新的干预的临床试验的真正的终点是总生存:时间,直至任何原因引起的死亡。“死亡”显然是有临床意义的,以患者和医生,因此,如果干预增加存活时间本应提供足够的理由来改变做法。替代标志物是肿瘤反应,即癌症的完全或部分缓解。替代终点通常与多个事件,这是相对快的介入被施用后观察到的相关联;因此,受试者可能不需要长期随访。这两个特性允许很短的时间空间来进行一个小的研究。观察在替代标记没有变化通常表示存在不太可能是在真实终点的效果,因此避免了不必要的大型研究。
限制
The main problem with small studies is interpretation of results, in particular confidence intervals and p-values (fig. 1⇑)。在进行研究性研究时,利用观察到的估计值和95%置信区间来估计真实效果。考虑假设的临床试验,评估四种新的减肥饮食(表1)⇓)。The results for diet A are clear: they are clinically important (the weight loss is large) and highly statistically significant (the p-value is very small, indicating that the observed weight loss of 7 kg is unlikely to be due to chance). The true mean weight loss associated with the new diet is estimated to be 7 kg, but there is 95% certainty that the true value lies somewhere between 6.4 and 7.6 kg. Ideally all intervals should be as narrow as this, but usually only large studies can produce such precise results. In diets B and D, the confidence intervals are also narrow, but all around a small and clinically unimportant effect so one can be fairly confident that these diets are not worthwhile. The statistically significant result for diet B is simply due to performing a very large study, but it would not justify using the new diet.
最困难的结果解释是那些饮食C.虽然置信区间包括零,大部分的范围是低于零和p值刚好高于0.05常规截止值。这很可能是由于不是足够大的研究。数据必须仔细解释。缺乏具有统计学意义并不意味着没有效果3,because the true mean weight loss could be 3 kg, or even as large as 6.3 kg. It is better to say “there is some evidence of an effect, but the result has just missed statistical significance”, or “there is a suggestion of an effect”. There needs to be a careful balance between not dismissing outright what could be a real effect and also not making undue claims about the effect.
小型研究的另一个主要限制是,它们能产生假阳性结果,或者他们高估的关联程度。Table 2⇓通过评价沙利度胺治疗肺癌的试验说明了这一局限性4,五。在小范围的研究被报道后,人们对沙利度胺有了很大的希望,尤其是因为它是口服的。然而,大规模试验并没有显示出任何益处。
统计分析也有局限性。在检查危险因素或其他关联时,通常需要考虑重要预后因素(混杂因素)的影响。这是通过多变量线性或逻辑回归和Cox回归(生存数据)等方法完成的。然而,当观察的数量很少,研究人员试图根据几个因素进行调整时,这些方法可能无法产生合理的结果,或者产生不可靠的结果。
结论
没有什么精确的关于样本大小估计设计研究时。它提供了研究的大致规模。这并不重要,如果一组假设产量100名受试者,但另一个给110,因为这仅代表每组一个额外的五个科。更重要的是,是否需要100个或200科目。总是有参与指定为假设样本大小,确定所述影响大小,这常常是从什么是在研究结束时观察到的完全不同的特别是当一些猜测。
没有什么错进行精心设计的小型研究;他们只需要仔细解释。虽然小规模的研究可以快速提供结果,他们通常不会产生可靠的或精确的估计。因此,不使强的结论有关的危险因素或审判的干预,其结果是正还是不是很重要。取而代之的是,从这些研究数据应被用来设计更大的验证性研究。如果目的是提供一个风险因素或新的干预可靠的证据,这项研究应该足够大,这样做。的编辑部欧洲呼吸杂志经常检查非常有趣的研究,但基于小样本量。而主板鼓励这些数据的最佳使用,编辑必须考虑到小规模的研究有其局限性。
利益声明
没有宣布。
- ©ERS杂志有限公司