抽象
本研究的目的是验证和比较已发表的预后分类,以预测小细胞肺癌患者的生存。
我们汇集来自第三阶段的数据随机临床试验,并用Cox模型进行验证和一致性概率估计为评估预测能力。
我们包括693例患者。所有的分类上存活的范围1.57-1.68(所有P <0.0001)显著的影响,与风险比(HR)。中位生存时间为,最好的预测组16-19个月,而他们大都是预测不佳组6-7个月。大部分的配对比较差异有统计学显著。限制了分析患者的广泛的疾病时,我们得到了类似的结果。还进行了多变量Cox模型拟合生存数据。用于单个协变量的HR为8.23(95%CI 5.88-11.69),和9.46(6.67-13.50),以及用于广泛的疾病是5.60(3.13-9.93),12.49(5.57-28.01)和8.83(4.66-16.64)。一致性概率估计介于0.55-0.65(重叠的置信区间)。
已发表的分类经过验证,适合在人群水平上使用。正如预期的那样,个人层面的预测仍然存在问题。为广泛疾病患者设计的特定模型似乎并没有表现得更好。
尽管小细胞肺癌对放疗、化疗敏感,但患者预后差,5年生存率<10% [1]。最可重复的预后因子是疾病程度,这也是指导治疗的主要因素。很少有其他预后因素已经明确规定:性能状况,性别等常规生物学参数,如中性粒细胞或白细胞计数,或albuminaemia [2,3]。我们集团,欧洲肺癌工作组(ELCWP),长期以来一直感兴趣的预后因素的识别,以及他们可能在护理可用于为病人提供信息和临床研究的分层随机过程的分类系统集成或调整治疗的比较。在2000年,我们发表这样的分类,这我们构建使用两种不同的统计策略:递归分割和合并(RECPAM)算法,这自然导致患者分类,和Cox回归模型[4]。该RECPAM技术包括与患者的整个群体开始,然后根据对结果(在本案中总生存期)最高的显着性水平的预后协将其分成组。一旦人口已被分成两组,一新的分割搜索是所获得的两个节点上分别进行。直至不再变量被识别为显著的预后因素,或直到患者的数量变得太小分区过程迭代地进行。然后将第二迭代算法被施加,如从树的不同分支中获得的终端节点不一定对应于患者显著不同存活分布。该融合算法的应用程序后,分类是即时的。从四个临床试验(一个相II和三个III期临床试验)登记763例患者的数据,我们提出了基于疾病程度,卡氏的性能指标,年龄,性别和相对中性粒细胞计数的分类。我们的系统包括四组:一个与预后最好,只包括有限疾病的患者;一个与预后最差,只包括广泛的疾病患者;和两个中间基团组成的任意疾病程度的患者。 To date, the RECPAM classification and final Cox model have not been further tested with the intent to validate them. Moreover, therapeutic standards have changed with the introduction of combined thoracic radiation and chemotherapy for patients with limited disease. We conducted the present study on a new series of patients with small cell lung cancer with two objectives: 1) to validate our published classification and Cox model; and 2) to validate other previously published classifications/models and compare the different prognostic systems.
材料与方法
我们搜索文献中对于其他已发表的分类基于一系列患者的样品大小> 500名受试者和仅包括纯粹的预后因素(不包括治疗性协变量)。的500名患者的限制完全是任意的,而是认为有必要提供一种低方差生存分布的估计。我们确定了与已发布的分类其他四个研究;所有都是基于RECPAM [2,五-7]。当文献还提出了基于回归分析的模型时[2,4,7],我们在比较考虑这一点。
所有选定的分类和模型是基于临床,人口或常规生物变量。所有RECPAM分类导致四个预后组,其分类的由福斯特提出的例外et al。[7],其重点是治疗广泛的疾病,并有五个不同的预测水平。Cox回归模型有四到五个因素来解释整体生存的分布。最常用的协变量疾病程度,性别和年龄。其他协变量乳酸脱氢酶水平,白细胞或中性粒细胞计数,肌酐水平,碱性磷酸酶,或与疾病阶段的变量。完整的分类和型号都在网上补充材料提交。
作为验证系列中,我们使用了三个进一步的临床试验数据库的ELCWP小细胞肺癌患者进行的,从1992年到2008年。这些研究中的两个关闭,结果已经发表构成一个共用的数据库(1923年ELCWP [8]和ELCWP 1922 [9]),而一个仍在进行(ELCWP 1994)。不包括在使用我们的预后分类的推导的数据库在这些研究中登记的患者的数据[4]。这些都是III期临床试验及其特点在网上补充材料说明。包括治疗广泛的疾病和治疗的两项试验包括化疗的孤独。第三个试验是献给患者限性疾病谁是联合放化疗和解决的顺铂的可能radiosensitising效果的问题。对于正在进行的审判,只有患者随机10月31日之前,2007年被列入本分析构建,从而实现了理论随访时间> 2年,所有患者的数据库。
一些合格标准是共同的三个试验和类似用于在我们以前的研究认为该试验合格标准[4]。小细胞肺癌不得不病理证实和未经处理的;患者必须有正常的血液,肝,肾功能,有一个≥60卡氏评分,都提供了知情同意书,并为后续的访问。有限疾病的定义是一种疾病局限于原发部位,纵隔和同侧锁骨下没有恶性胸腔积液淋巴结在一项试验[8]。在另外两项研究,它被定义为可以在一个野放疗治疗的疾病。在试验评价标准包括对治疗化疗后的三周至六个月的课程,和无进展生存率和总生存率。
统计方法
本研究的目的是,首先,结果的验证ELCWP于2000年出版,并其次,评估和选择的先前公布RECPAM分类和Cox模型的预测值进行比较,采用新系列的病人。评价标准是总生存期,从登记在试验中测出。所有死亡病例考虑。
所有五个公布的分类评估所需的数据每个试验进行期间前瞻性地收集。
我们使用的生存分布的非参数估计和比较用log-rank测试以及危险比(HR)的估计基于Cox回归模型。为了评估先前公布Cox模型的预测值,我们构建了一个基于公布的回归系数的整体得分。原来的分数被转化为具有相同范围的理论值,以使模型之间的HR估计值进行比较。
正如我们已经为患者病变广泛一种模式具体,我们测试了所有的患者和患者亚组广泛的疾病的一般分类和型号。
在前两个发表的试验,我们用于构建我们的验证系列中,我们没有找出武器[之间的任何生存获益8,9]。对于第三个,正在进行的试验,我们不看武器的生存率比较。我们没有通过试用我们的分析使用任何分层,作为一项试验是献给只有有限的疾病患者和其他人仅限于治疗广泛的疾病。
为了评估预后协变量的预测能力,我们使用了一致性概率估计[10]。
所有的意义是概率双尾;p值<0.05被认为是统计学显著。
结果
我们收集了共693例,204数据从ELCWP 19229], 233(1923年ELCWP) [8]并从正在进行的试验256(1994 ELCWP)。有具有招募患者进行的推导系列机构和促进用于本验证系列试验的机构之间的交叉点。然而,重叠总不和我们的验证项目是内部验证和外部验证[之间的中间11]。病人的特征在表格1。与我们的衍生系列相比,女性和Karnosfky指数≥80的患者的比例均有增加。有限疾病患者的比例低于我们之前的研究。一些生物学参数的缺失使得我们无法评估所有患者的五种分类。根据不同的分类,数据丢失率在1-12%之间。
随访中位数长度为119个月;在646(93%)患者中观察到死亡。理论随访> 2年中的97%的患者和> 5岁的患者的85%。
分类分布
表2提出了分类对验证系列的分布,对所有患者和患者亚组广泛的疾病。对于分类的每个类别频率的患者排除与丢失的数据,阻止我们给它们分配一个类别后提出。对于每一个分类的,较低的类别,更好的预测生存时间。根据不同的分类,患者选择为具有最佳预后的比例为17-31%,并且患者的预后最差的比例为11-26%。
验证研究
图1根据ELCWP预后分类节目存活曲线。I组为90周的估计的中位生存时间,用48,34和28周的基团II,分别III和IV,进行比较。整体比较是高度显著(P <0.001),使用预后分类为连续的协变量,以及所有的成对比较。我们以前的Cox模型确定了四个独立的预后协变量。表3提供验证系列的最新估计回归系数,如果将所有四个协变量与派生模型的分类一起输入到模型中。其中三个p值有统计学意义(p<0.0001),而最后一个性别p值不显著,p值为0.08。采用RECPAM分类后,模型的拟合优度得到提高,采用Cox分类后,模型的拟合优度进一步提高,证实了综合模型的有效性。
预测模型的比较
在表4,我们给出了每个预后类别的中位生存时间的估计,并使用非参数估计方法和log-rank检验全面比较反映了每个RECPAM分类的总体预后价值。当对所有患者进行分析时,每种情况下的总体比较都是非常显著的。HR估计范围为1.57-1.87(在将一个类别与相邻的较高类别进行比较时发生变化)。这意味着预后最差的那一组的危险是预后最好的那一组的4到5倍。这些HRs之间没有异质性。由于总体比较均显着,我们进行了配对比较(组ñ与A组比较ñ1),其结果在被呈现表5。对于Albain的分类et al。[五],差异无统计学证据表明,II类和III有不同的生存分布。福斯特的分类et al。[7],以广泛性疾病患者为研究对象,不能证明I组与II组存在差异,且II组与III组比较也不显著。第四组没有被分析,因为在我们的系列中很少有病人属于这一组。
三个Cox模型的回归系数来计算整体预后评分。分数以0和2之间的比例(在患者群体的年龄18-85岁)进行了变化标准化。与这些得分相关联的的HR示于表6并且都是从1更近的模型[显著不同2,7]似乎比第三[更好执行4]。
讨论
预后因素的研究在文献中数不胜数。然而,重复性和完善独立的预后因素是缺乏[3]。事实上,大多数时候,是回顾性进行的预后因素鉴定,并有几乎没有患者的小细胞肺癌。第三阶段的预后因素的研究,由西蒙和奥特曼[描述11],被前瞻性与进行先验根据这些假设所需的样本大小的假设和评价。因此,它是为了验证结果至关重要利用它们之前。此外,为了进行验证的一个因素需要独立的预后价值。在这种情况下,我们并不需要验证一个单一的因素,而是一组的预后因素,因此,分类或模型。有几种可能性进行验证练习:内部验证与交叉验证或引导技术或新系列的患者外部验证,这是继续尽可能[更有说服力的方式12]。有几个因素可以考虑外部验证过:利用患者招募在同一机构,并在同一时间段比大于包含在推导组患者进行验证研究对不同来源的患者和发生疾病后少将军。我们进行了前期研究的外部验证[4]与它的历史传输性的评估,如通过正义定义et al。[13]。然而,一些机构已经对两个系列的病人作出了贡献。应当指出的是,国际协会肺癌的研究(IASLC)构建的分类分期项目不是完全独立的,因为ELCWP促成了全球数据库的宪法,有可能是从其他系列数据也集成到数据库中。这以后分类已经被验证为,在国际肺癌研究协会的研究中,患者三分之二用于模型推导,三分之一用于验证。除了事实验证是完全不对外,我们应该强调的是,我们的研究是回顾性的,导致一些缺少数据的分类/模型的评估,并在需要的协变量进行评估的方式一些异质性。此外,我们的患者人群仅限于在临床试验注册的患者群体,限制了结论的普适性。
我们的验证是成功的为我们的RECPAM分类和我们的纳入临床试验患者群体Cox模型,尽管治疗策略已经与引进相结合放化疗方式的有限的疾病演化而来的。患者的局限性病变预后有所改善,我们可以推测,这是分期技术更高的准确性和更有效的治疗的共同作用的结果。此外,我们验证了四组我们的分类,因为有序配对比较均显著。I组,其中包括仅患者限性疾病,可能是用于开发新的治疗方法的目标。我们的模型的验证第二个结论是,患者属于不同群体的风险预测和真正的生存时间之间的一致性不足以利用该模型在个别病人的水平。建立在Cox模型预后协比RECPAM分类,这可能是一个令人失望的结果稍微好一点的执行,因为RECPAM分类似乎并没有受益于分类的建设过程中自然地整合了互动效应也。最后,当应用于治疗广泛的疾病我们的模型的性能下降。
大多数这些结论的时候,我们正在寻找在本研究之前出版或新近开发的其他建议预后分类保持真实,有一个全球性的验证,最有序的配对比较是显著。其中的例外是在Sagman的分类I和II组之间的比较et al。[6]。这可能是由于患者在我组,并在该环境中缺乏力量的一小部分。此外,最近,也限性疾病的概念可能都来对应于一个高度选择的患者群体。另一个例外是组II和III在IASLC分类[之间2]。属于II组患者的比例也相当小,并有可能再次成为权力的问题在组II和III之间的距离的确认。对于Sculier的分类组之间的最相关的区别et al。[2],Paesmanset al。[4)和Albainet al。[五]似乎是组的识别用的最佳预测存活分布(组I),即有限疾病的患者与其他有利的特征。根据不同的分类,这个群体或多或少严格的定义,与集团的规模和它的中位生存期的逻辑后果。
其中预后分类[7我们专门为患有广泛疾病的患者开发了compare,希望能更具体、更准确。从我们的研究结果来看,情况并非如此,这表明其他的协变量比被测变量更重要,或者其他协变量的影响与更高的可变性有关。我们的样本量可能也不够,因为这种分类是基于有限验证系列中的五个组。所有模型的一致性概率估计评估的预测能力,在广泛疾病患者的受限人群中下降。
这里所有研究的模型是基于易于评估的变量(年龄,性别和常规实验室参数),或将被要求以确定肿瘤分期和治疗策略反正变量。因此,应该推荐使用至少一个分级分层的患者在临床试验或允许患者人群的比较。事实上,所有的都是有价值的,因为有两个模型之间没有相关差异。据我们所知,这是第一个工作验证几种分类系统。所有这些都被证明是成功的另一系列,再次表明它是确定隔离的预后因素,而不是将它们集成到一个预测系统和几种预后系统的相关性较低,但基于不同的协变量,可能有可比性判别和预测值。疾病的程度,年龄,性别和体能状态,然而,在分类的基础。
这些分类中没有考虑到分子生物学因素或基因标记,并有确实的改进空间,如一致的概率估计是显然不能令人满意。然而,因为他们是很简单的评估,这些新的可能影响预后的因素任何研究应该比较的更昂贵的预后工具,以更简单的测试的预测能力。
脚注
这篇文章有提供补充材料www.www.qdcxjkg.com
利益声明
没有宣布。
- 收到2010年7月14日。
- 公认2010年12月15日。
- ©2011人队