摘要
本系统评价是在欧洲肺癌工作组(ELCWP)的主持下进行的,目的是确定早期中间标准(替代标记物),而不是生存期,在确定肺癌患者的治疗效果方面的作用。首先,我们回顾了使用总生存期来评估治疗疗效的证据水平。ELCWP随后制定了9个问题。在与专家就这些问题回顾文献后,可以得出结论,总生存期仍然是预测肺癌治疗疗效的最佳标准。一些中间标准即使不能作为生存的替代指标,也可以作为生存的早期预测指标,尽管其潜在应用存在局限性:包括进展时间、无进展生存期、客观缓解、放疗后局部控制、局部晚期非小细胞肺癌(NSCLC)的降期、切除术后NSCLC的完全切除和病理性TNM,以及一些循环标志物。这些建议中评估的其他标准目前还不能充分替代肺癌的生存。
欧洲肺癌工作组(ELCWP)是一个合作研究小组,30多年来一直积极参与胸部肿瘤的学术临床试验。在不同阶段和不同组织学类型肺癌的试验报告,可在ELCWP网站(www.elcwp.org).该小组还参与循证医学研究,并发表了许多元分析和系统综述[1],以及小细胞肺癌(SCLC)及非小细胞肺癌(NSCLC)的治疗指引[2- - - - - -6].
提高生存率或治愈率是肺癌治疗的主要目标。其他疗效标准通常被用作临床研究和随机试验的主要终点,主要涉及疾病控制(持续时间和反应)和生活质量(QoL)或症状控制。在过去的十年中,出现了一些新技术,对肺癌的治疗方法产生了一些影响,例如将正电子发射断层扫描集成到分期策略中,或使用组织和血液生物标志物来预测生存预后或治疗效果。上述中间标准已被一些研究人员提出作为肺癌的主要疗效标准。然而,目前尚不清楚这些标准是否能正确预测总体生存率。
中间标准可以取代临床试验中的最终终点,从而提供一些优势。它们比特定疾病死亡率或总生存率发生得更频繁或更早。术语“替代品”通常以非正式的方式使用,表示可以使用生物标志物或中间终点来代替最终终点。代孕的定义是在20年前由P的徒弟[7],他还定义了验证候选替代药物价值的操作标准:1)治疗应同时影响候选替代药物和真正的临床终点;(2)对替代体的治疗效果应充分体现对真实终点的治疗效果。由于第二个条件难以证明,而且在实践中也不合适,于是出现了其他定义。正如B提到的uyse等.[8],目前普遍存在一种共识,即可以在相关性方法的基础上验证替代终点:首先,应在个人层面上证明相关性;也就是说,替代终点必须被证明可以预测真正的结果;其次,应在试验水平上获得相关性(可以通过元分析技术评估相关性)。然而,展示代孕仍然是一项困难的工作。由于我们预计在肺癌领域只能找到很少的代孕证明,所以我们寻找了“简单”预测/预后真实结果的中间标记物。因此,我们在本报告中避免使用术语代孕/代孕,而是使用术语“预测”,“预后”或“早期”治疗效果的标记。
ELCWP制定了以下指南,以确定中间标准是否可作为肺癌患者总生存期的充分预测标志物。我们小组的主要目标是帮助参与肺癌患者治疗的临床医生将文献中的研究结果整合到他们的日常实践中。
方法
在比利时布鲁塞尔举行了一个专门讨论这一主题的初步研讨会,专家小组参加了会议(第十届胸科肿瘤学年度日;2009年3月21日)。这使得ELCWP对预测肺癌生存的中间标准的价值提出了建议。最初,我们回顾了使用总生存期来评估疗效的证据水平。此外,该指南旨在回答以下九个问题。1)无进展生存期(PFS)、进展时间(TTP)和无病生存期(DFS)是否可用于评估总生存期?2)化疗的客观形态学反应是有效的疗效标准吗?反应的评价标准是什么?3)客观的形态学反应标准和局部控制是否适用于放化疗的总体生存评估(无论是连续的还是伴随的)?4)生活质量标准能否用于预测总体生存,应采用哪种生活质量评分体系?5)诱导化疗后降期能否预测总生存期,需要采用哪种评估方法? 6) Do complete resection and pathological TNM have a predictive role for survival? 7) Can metabolic response, assessed by18正电子发射断层扫描f -氟脱氧葡萄糖的聚集(18F-FDG-PET或PET-CT),预测化疗疗效?8)组织生物学标记物在总体生存率评估中的作用是什么?9)循环标志物(分子或细胞)在总体生存率评估中的作用是什么?对于每个问题,都提供了中间标准的定义。
使用Ovid Medline系统进行文献回顾。这项研究由一名科学图书馆员进行,他在检索医学和科学出版物方面经验丰富,并由医生、胸部肿瘤治疗专家和循证医学培训专家在生物统计学家的协助下进行。
通过OvidSP接口搜索Ovid Medline。除非另有说明,搜索词是MeSH词(医学主题标题)。MeSH术语还与在包含文本词的所有字段中搜索的相关自由文本术语相结合,特别是在标题和摘要中。临床问题的“PICO”(人群、干预、比较者、结果)模型用于分离问题中包含的概念[9].相应的搜索条件被翻译成MeSH术语和自由文本关键词(在线补充材料)。完成的搜索策略包括“P”和“O”标准与在线补充材料中列出的一个可能的中间标记相结合。结果仅限于1986年至2010年3月期间发表的研究,除非需要检索旧的SCLC手术系列或随机试验来证明总生存期。当检索到的引用数量过大时,根据发表类型和证据水平应用额外的限制,随机对照试验和荟萃分析具有最强的支持水平。在少数情况下,通过排除继发性肺癌研究来减少背景噪声也是必要的。引用被从Medline导出到参考文献管理器数据库,以允许删除重复,并方便审稿人进行下一次选择。对导出的引用进行相关性扫描。当标题、摘要和MeSH术语不符合纳入标准时,文章在最初的筛选中被拒绝。对其余的文章进行了进一步评价,以便纳入目前的审查。 This search was supplemented by screening the references of the selected articles and other literature known by the research team and the ELCWP members.
为了符合资格,一项研究必须满足以下标准:致力于原发性肺癌的研究,无论其分期或组织学;为了处理肿瘤分期,至少对于研究中包括的大多数患者,使用第四、第五或第六版[10,11]的国际分期系统(SCLC除外);评估为指南选择的中间标准之一与生存之间的关系,至少在单变量分析中,它是否是发表的主要目标;以英语、法语、德语或荷兰语文学出版,所有合著者均可查阅。摘要被排除在外,因为它们不能提供足够的细节来评估方法和/或生存信息。然而,我们允许考虑未发表的研究,如果有详细的结果和方法,可以对当前指南进行充分的解释,例如,在大会网站上进行广泛的口头报告。
这些建议是根据建议评估、发展及评估的职级制度[12];该方法总结于表1.出版物的选择是根据这个系统进行的。最好的证据是系统地寻找的。研究最初仅限于元分析和随机对照试验;如果没有,我们寻找病例对照、队列或前瞻性研究;最后考虑病例报告、病例系列和专家意见。我们将建议分为强或弱,支持或反对使用干预。当没有数据可以回答问题时,我们决定建议反对使用干预措施。
在ELCWP的三次研讨会上(2009年3月28日和10月16日,以及2010年4月16日),所有共同作者都撰写了一份草案,并对其进行了讨论,他们审查了文献中发现的证据。此后,ELCWP于2010年11月在布鲁塞尔举行的会议上审查了该指南,并由专家小组批准。作者包括医学肿瘤学家、胸外科医生、肺学家、放射肿瘤学家和参与胸部恶性肿瘤管理的方法学家(目标受众),这是由AGREE合作小组推荐的用于评估指南质量的(www.agreecollaboration.org).评论和建议随后被纳入准则的最终版本。中列出了证据水平、证据质量和推荐等级表2.
初步问题:用总生存期来评价治疗效果
根据美国食品及药物管理局[13],生存期定义为研究中登记或随机化与任何原因死亡之间的持续时间(以治疗意向衡量)。治愈则更难定义。世界卫生组织(世卫组织)提出了一种定义,其依据是患有该病的患者组的生存期,并将其与在具有可比人口标准但没有患病的一般人群中观察到的生存期进行比较[14].另一种选择是,当患者以良好的健康状况存活了足够长的时间,与已知低复发概率的一组患者相当时,就认为患者已经治愈。
肺癌患者的生存评估作为治疗疗效的一个标志,可以在五种情况下进行评估:可切除的NSCLC,不可切除的非转移性NSCLC,晚期和转移性NSCLC,以及局限性和广泛的疾病SCLC。本评估是基于ELCWP (www.elcwp.org) [2- - - - - -6].
1)由于明显的伦理原因,在可手术切除的NSCLC患者中,没有进行单独手术与其他药物治疗或不进行治疗的随机试验。手术提高总体生存率和治愈率的证据水平是基于回顾性和前瞻性手术系列的历史数据[15].根据其他指南,手术是I期和II期疾病的治疗选择,III期NSCLC仍然是一种治疗选择。随机试验和荟萃分析表明,与单独手术相比,日本患者的辅助化疗和诱导顺铂化疗(在较小程度上)以及UFT(尿嘧啶-替加福)延长了生存期,至少在II期和III期NSCLC中[16,17].
2)单独放疗治疗不可切除的非转移性NSCLC的证据来自单独放疗治疗的随机试验对照组,或来自可切除的不能手术的NSCLC患者系列(I期和II期)的推断。记录的5年生存率为4-10% [18,19].与单纯放疗相比,在治疗性放疗的基础上加入化疗,无论是连续的还是伴随的,都能提高生存率和治愈率。这些证据来自随机试验和元分析[20.- - - - - -25].
3)至少15项随机试验和5项荟萃分析证实,在晚期和转移性NSCLC中,与单独进行最佳姑息治疗相比,一线化疗可提高生存期[20.,26- - - - - -29].两项随机试验表明,与姑息治疗相比,多西他赛或厄洛替尼的挽救性化疗也能提高生存率[30.,31].
4)在比较烷基化剂和惰性化合物的旧随机试验中,首次观察到SCLC一线治疗化疗对生存期的影响,结果显示环磷酰胺单药治疗可提高生存期[32].目前,多药给药已成为标准的化疗方案。在这种情况下,两项荟萃分析表明,顺铂和/或依托泊苷化疗比其他方案更有效,生存率更高[33,34].在有限疾病SCLC中,15项随机试验和3项荟萃分析表明,与单独化疗相比,放疗加化疗可提高生存期[35- - - - - -37].只有一项随机试验比较了拓扑替康与姑息治疗的挽救性治疗,化疗可提高生存率[38].
总体生存率的优势在于明确(病人是死是活)。评估一组患者生存期的分布应使用概率论,而不是简单的死亡率。这种方法的主要缺点是后续治疗对总生存期的影响,在长期生存的情况下,随访时间和随访损失的风险。
综上所述,提高总生存率或治愈率被广泛认为是肺癌治疗的重要目标,通常被认为是肺癌患者治疗效果的主要标准。
后面的问题没有按任何特定的等级顺序列出。
问题1:pfs、TTP和DFS的标准能否用于评估总生存率?
PFS定义为研究中登记或随机化到疾病第一次客观加重或死亡之间的持续时间。TTP是从参加研究到疾病进展的第一天的时间。DFS是指在研究中登记或随机到肿瘤复发或死亡之间的时间。该标准主要用于辅助治疗和没有更多目标病灶时的手术设置[39].
迄今为止,已经发表了两篇评估TTP对肺癌患者总生存期预测价值的荟萃分析[40,41].在2008年美国临床肿瘤学会(ASCO)会议上口头提出了对选定随机对照试验的汇总分析[42].虽然没有全文发表,但它被选为本指南,因为详细的结果和方法可在ASCO网站上获得。这三项研究的结果发表在表3.这三项研究在随机对照试验中处理了一线化疗治疗的晚期非小细胞肺癌。在两项已发表的研究中[40,41],发现TTP与总生存期之间存在统计学意义上的相关性,但幅度有限。Hotta等.[41],中位TTP比率占中位生存率变异性(41%)的一半不到。为了预测p值为0.05时生存时间的统计学显著改善,750例患者的试验中TTP中位数必须分别增加1.8个月,500例和250例患者的试验中TTP中位数必须分别增加2.2个月和3.3个月[40].后一项研究提供了PFS与总生存率之间关系的一些证据[42]: PFS评估的进展风险降低30%,预测一线多西他赛或长春碱类治疗方案治疗的晚期NSCLC患者的总生存期具有统计学意义。必须指出的是,最近在比较化疗与表皮生长因子受体酪氨酸激酶抑制剂(TKIs)的随机试验中,这种改善PFS与进一步提高生存率之间的正相关关系尚未得到证实,尽管PFS倾向于TKI治疗的风险比很高[43- - - - - -45].
我们没有发现将PFS、TTP或DFS作为可切除NSCLC手术治疗或不化疗、不可切除NSCLC放化疗、接受挽救性化疗的NSCLC和SCLC总生存的中间标记物作为主要目标的meta分析或具体研究。
PFS、TTP和DFS在前瞻性研究中具有潜在优势,可以减少应计患者数量,缩短随访和研究时间,减轻后续治疗对研究终点的影响。所使用的参数有许多缺点,如下所示。决定客观进展的最佳标准是什么?你如何看待调查人员在评价标准上的分歧?你如何处理结果解释中没有盲法的情况?最重要的是,所有这些参数都高度依赖于两次疾病评估之间的持续时间和评估类型,而评估类型必须独立于治疗部门。
建议
1) TTP是一线化疗晚期NSCLC总生存期的中间指标。证据水平:荟萃分析;证据质量:3;推荐等级:Fs。
2) PFS是多西他赛或vinca-生物碱一线方案中潜在的生存中间标记物。证据水平:荟萃分析;证据质量:2;推荐等级:Fw。
语句
需要更多的证据来证实TTP或PFS和DFS是预测以下情况下总生存的中间标准:可切除的NSCLC患者通过手术治疗伴或不伴化疗,不可切除的NSCLC患者通过放化疗治疗,NSCLC患者通过挽救性化疗治疗和SCLC患者。由于缺乏数据,不能推荐DFS作为总生存期的中间标记。
问题2:化疗的客观形态学反应是有效的疗效标准吗?反应的评价标准是什么?
客观反应的第一个定义是由C.G. Zubrod在1960年提出的。目前有三个系统可供选择(表4).所有这些都是基于专家意见,没有采用适当的统计方法来选择确定不同类别的答复的分界点。世卫组织系统于1979年公布[14].西南肿瘤学小组(SWOG)在其研究中使用了自己的定义,接近世界卫生组织的定义[46].实体肿瘤反应评估标准(RECIST)于2000年制定,用于临床研究[47].RECIST和WHO/SWOG标准之间的主要区别是:使用一维而不是二维测量,限制目标病灶数量(每个器官最多5个,总体最多10个病灶),以及不同的反应和进展截止点。最新版本的RECIST最近已出版[48].1.1版本的主要修改是考虑每个器官最多2个病灶,并将淋巴结完全缓解定义为短轴不超过10mm的淋巴结。
迄今为止,已经发表了7项荟萃分析,作为研究的主要目标,评估了化疗的客观反应与生存之间的关系[40,49- - - - - -54].客观缓解和/或疾病控制(客观缓解加上病情稳定)预测在以下情况下总生存期的改善:接受一线或挽救性化疗的晚期NSCLC和接受一线化疗的广泛疾病SCLC (表5).在三项荟萃分析中,反应对总生存期的影响进行了量化。随机试验纳入750例患者,反应率增加18%,总生存期增加有统计学意义(p<0.05)。如果患者人数为500或250,则此值分别增加至21%和30% [40].在另外两项研究中,响应率每增加1%,接受TKI患者的中位生存时间提高0.26个月[54]或0.07个月的挽救性化疗[51].在明确时,反应的评价标准通常是WHO和RECIST的标准。然而,尚未对肺癌患者进行过两种系统的正式比较。我们还研究了大型回顾性研究,汇集了肺癌的前瞻性试验(表6)) (55- - - - - -58].客观反应也被发现是晚期和转移性NSCLC更好生存的一个重要预测因素[55- - - - - -57]在南方基督教领袖大会[58],无论疾病处于什么阶段,都要接受化疗。
在以下临床环境中,没有荟萃分析或随机试验将反应评估作为生存的中间标准:可手术NSCLC的诱导化疗,局部晚期NSCLC的顺序或伴随放化疗,以及有限疾病和复发SCLC。术前诱导化疗或局部晚期NSCLC治疗、放疗前诱导化疗、放化疗或单独放疗有客观反应的NSCLC患者生存率更高[59- - - - - -64].证据水平来自对每个主题发表的随机试验次要目标的分析(表6)及第II期研究[66- - - - - -74].我们发现SCLC中只有一项研究显示完全缓解的患者比部分缓解或无变化的患者生存时间更长,一线化疗或放化疗进展的患者预后最差[65].
很少有正式的比较可以决定使用哪些评价标准。在RECIST出版刊物[47],在RECIST 1.0与WHO标准的比较中,无论是考虑整个人群还是仅考虑肺癌患者,在评估客观缓解或进展方面均未发现任何显著差异。在肺癌患者中进行了进一步的研究,总结在表7.总体而言,两种评估系统在反应确定方面没有显著差异[47,75- - - - - -79].
建议
1)客观缓解是一线或挽救性化疗治疗晚期NSCLC总生存的中间标准。证据水平:荟萃分析和随机试验;证据质量:4;推荐等级:Fs。
2)客观缓解是一线化疗治疗广泛性SCLC患者总生存的中间标准。证据水平:荟萃分析和回顾性研究;证据质量:2;推荐等级:Fw。
3)客观缓解是可手术NSCLC诱导化疗和局部晚期NSCLC化疗和放疗总生存的潜在中间标准。证据水平:回顾性研究;证据质量:2;推荐等级:Fw。
语句
需要更多的证据来证实客观缓解是预测以下情况下总生存的中间标准:可手术的NSCLC诱导化疗,局部区域晚期NSCLC和有限疾病的SCLC化疗和放疗。
WHO和RECIST 1.0标准似乎在预测局部区域晚期和转移性NSCLC的客观缓解方面具有相同的疗效。在现有数据的基础上,尚不可能确定在其他与肺癌管理相关的情况下使用的最佳反应标准,必须在更大规模的研究中确认WHO和RECIST标准的等效性。
世卫组织和RECIST系统提出的定义反应/进展的分界点需要进行验证评估。
在维持治疗的背景下,疾病控制率(缓解加疾病稳定)需要验证评估。
问题3:在放化疗的情况下,客观的形态学和代谢反应标准和局部控制是否适用于评估总体生存(无论是连续的还是伴随的)?
根据常规标准(WHO和/或RECIST)对胸部照射引起的肺炎和纤维化改变的反应进行定义时存在许多问题,必须将其与残留的肿瘤组织区分开来。由于这些变化与时间有关,并因使用放射增敏化疗药物而增加,治疗后评估的时间可能会影响反应评估。
一些小型回顾性研究评估了PET(-CT)等新评估技术的作用。在73例接受放射治疗或放化疗的NSCLC患者中,分别使用欧洲癌症研究与治疗组织(EORTC)和WHO标准进行PET和CT反应评估(kappa 0.35)的一致性较差。在多因素分析中,只有PET反应与生存相关(p<0.0001) [80].在第二项研究中,包括50例接受诱导放化疗的患者,其中37例接受手术治疗,诱导治疗后PET-CT上标准化摄取值(SUV)的变化与生存无关(p=0.75) [81].最后,越野车马克斯预测手术NSCLC患者在诱导放化疗后的生存。SUV患者的中位生存期较长马克斯小于4辆SUV多于4辆,即56个月与19个月(p<0.001) [82].
局部控制是另一种常用的胸内反应评估方法。1993年在比利时布鲁日召开的一个共识专家会议上,定义胸部照射后肺癌局部控制的建议是:胸部CT检查的所有影像学异常完全消失,胸部CT检查的影像学残留异常在3个月和6个月后保持稳定,6个月或6个月以上。这一定义从未成为验证研究的主题。
关于这个问题的文献相对令人失望。我们发现只有少数回顾性研究或随机试验的二次分析评估了肺癌局部控制和生存率之间的关系。Birch等.[83]对局限性疾病SCLC的观察发现,放化疗后实现局部控制的患者生存时间比未实现局部控制的患者更长。在一项小型回顾性研究中,包括局限性和广泛性SCLC, C牛等.[84也有同样的观察。Dosoretz等.[85]表明局部控制可提高照射后医学上不能手术的NSCLC的生存率。在放射治疗肿瘤学组随机试验的回顾性研究中,局部控制与生存率显著提高相关[86].然而,ELCWP在一项比较化疗与化疗后放疗的III期不可切除NSCLC的III期试验中无法证实这些结果[87].联合组局部控制持续时间显著增加:中位数为158周与31周,2年生存率分别为57%和24% (p=0.0007)。较好的局部控制时间并没有导致生存时间的统计学显著增加:中位数为54周(95% CI 43-73周)。与42周(95% CI 35-51周),2年生存率为22% (95% CI 11-33%)和18% (95% CI 8-28%)。
建议
1)虽然常用,但(化疗)放疗治疗的原发性肺肿瘤反应评估的常规标准不能作为生存的中间标准。证据水平:回顾性研究;证据质量:1;推荐等级:哦。
2)局部控制是整体生存的一个可能的中间标准,其定义需要澄清。证据水平:回顾性研究;证据质量:1;推荐等级:Fw。
声明
WHO或RECIST常规标准、代谢反应标准(PET成像)和局部对照作为肺癌(化疗)放疗治疗的中间标准的作用必须在前瞻性研究中进行评估。
问题4:生活质量标准可以用来预测总生存率吗?应该采用哪种生活质量评分系统?
我们在与此主题相关的文献中发现了一些数据,尽管有许多论文表明基线生活质量数据具有预后作用[88- - - - - -90].目前存在几个评分系统,并已通过专门用于肺癌症状和治疗副作用的模块的可用性进行了验证。与生活质量对其他结局(化疗反应、PFS和生存期)的预测价值相关的研究是EORTC生活质量核心问卷(30个项目),辅以肺癌模块LC13 [91,92]和癌症治疗功能评估-肺(FACT-L),其中包含针对疾病症状的特定模块(LCSS) [93].在研究这个预测值之前,有必要在生活质量水平上定义响应的含义。O荞麦面等.[94]根据生活质量评分演变与主观问题之间的一致性,将>总体EORTC生活质量评分增加10分定义为响应,>降低10分定义为进展,中间结果定义为稳定。C艾拉等.[95]提出了LCSS评分(从0到28,生活质量越高,值越高)和TOI(试验结果指数,是LCSS和功能和身体健康量表的总和,从0到84)两种结果的响应定义。对于第一个结果,需要增加2-3分,对于《印度时报》,需要增加5-7分。稳定和进展的定义来源于这些阈值。该建议来自于对一项临床试验的分析,并使用了生活质量演变与化疗反应或PFS之间的关联。
一项荟萃分析报告表明,生活质量与放射反应之间存在相关性(正相关),但该荟萃分析并非专门针对肺癌,存在严重的选择偏倚:在文献检索确定的350多项研究中,只有21项可纳入定量综述[96].
E吨等.[97]已经表明,对于晚期肺癌患者,使用临床试验数据库和FACT-L评分系统,将其分为四组(I: FACT-L基线评分高且改善;II:高基线伴恶化;III:低基线后有所改善;IV:低基线伴恶化)对TTP和总生存期有预后价值。I组效果最好,其次为II组、III组和IV组(p<0.001)。
C艾拉等.[98]研究了晚期肺癌易瑞沙剂量评估(IDEAL)-2试验中吉非替尼作为NSCLC二线治疗的患者的生活质量演变。与其他患者相比,生活质量缓解(>在LCSS量表上改善2点)的患者生存期显著延长(8周后,中位数为13个月,而5个月;p < 0.001)。来自IDEAL-1的数据指向相同的方向[99].在Iressa NSCLC试验评估联合治疗(完整)试验中,研究了一线化疗方案中吉非替尼的添加,使用EORTC生活质量问卷研究了生活质量和抗肿瘤反应之间的关系。不同量表(总体量表、物理量表、疼痛、咳嗽和呼吸困难)和反应的相关性均显著。然而,我们没有任何关于PFS或总生存期的生活质量反应值的可用数据[One hundred.,101].
建议
由于缺乏可靠的数据,不能建议将生活质量水平的反应作为总生存期的中间标准。证据水平:回顾性研究;证据质量:1;推荐等级:哦。
声明
生活质量水平的缓解与长期结果之间的关系,如在某些情况下(吉非替尼治疗复发性NSCLC),需要进一步的调查,包括充分确定界定缓解的分界点,以及最合适的问卷。
问题5:诱导化疗(无线电)治疗后的降期能否预测总生存期,需要使用哪种评估方法?
降期可定义为治疗后向较低疾病阶段的转变。在NSCLC中,评估诱导化疗后降期对生存的预后作用的研究已在纵隔(N期)或TN水平进行。文献通常是异质的。每个研究的纳入标准根据阶段、纵隔评估(临床或病理定义)、治疗类型(术前诱导化疗或放化疗;仅非手术治疗)和降期类型(N或TN)。大多数出版物是小样本量的II期研究的病例系列或回顾性分析。我们发现只有两个III期试验对这些问题进行了回顾性分析。第一项试验比较了手术与放疗在诱导化疗治疗IIIA期病理性N2 NSCLC中的作用[102].在包括154名随机患者的手术组中,多变量分析显示纵隔降期是生存的独立预后因素(p=0.04)。在第二项试验中,在III期病理性N2 NSCLC中,将单纯放化疗与放化疗加手术相比较,单因素分析中,手术组(164例患者)纵隔降期与更好的生存相关,病理N0和N1-3的中位生存时间分别为34.4个月和26.4个月(p<0.0001) [103].
非小细胞肺癌的纵隔降期已通过非侵入性(CT和PET扫描)、微创性(食管(EUS)或支气管(EBUS)内窥镜手术)和侵入性手术(再纵隔镜和视频辅助胸腔镜手术(VATS)进行评估。在其2007年的指南中,欧洲胸外科医生协会没有推荐一种特殊的重新安置手术,但建议通过微创或侵入性手术获得细胞组织学证明,这取决于中心工作人员的可用性和特定的专业知识[104].最近回顾了有关纵隔再植的文献[105].纵隔CT重新定位的敏感性、特异性、假阴性率和假阳性率平均分别为63%、70%、31%和34%。PET扫描分别为63%、70%、26%、34%。联合PET-CT似乎更合适,敏感性62-77%,特异性88-92%,假阴性率20-25%,假阳性率7-25%,准确度79-83% [106,107].很少有研究评估微创手术在纵隔再分期中的作用。在三个非常小的研究中评估了EUS,一个是EBUS,另一个是经支气管针吸入。平均敏感性和假阴性率分别为84%和14%。由于粘连和纤维化,重新纵隔镜检查在技术上具有挑战性。在一些研究中,该技术的敏感性为63%,特异性为100%,准确度为84-93%。假阴性率为22%。在70例小范围患者中评估了VATS [108].17例患者因纤维化而手术失败。报道的敏感性、特异性和阴性预测值分别为75%、100%和76%。
建议
尽管没有得到严格的证明,但来自随机试验和回顾性研究的亚组分析的大量结论表明,在手术前通过诱导化疗或放化疗治疗的局部晚期NSCLC中,纵隔降期和TN降期(在较小程度上)与更好的生存有关。证据水平:回顾性研究;证据质量:2;推荐等级:Fw。
语句
诱导化疗(或放化疗)后降期与长期结果之间的关系应得到证实,并需要在充分有力的前瞻性研究中进一步调查。
PET-CT是推荐的纵隔再植的非侵入性技术,比CT扫描更精确,在这种情况下,CT扫描似乎不够准确。术前需确认纵隔病理持续性肿瘤浸润时,微创或侵袭性技术均可行,且疗效相似。技术的选择将取决于当地的专业知识和最初用于显示纵隔侵犯的技术。
问题6:完全切除和病理性TNM对生存有预测作用吗?
完全切除定义的基础是国际抗癌联盟(UICC)残余肿瘤分类(R分类)[109].R0类包括原发部位、淋巴结及远端部位无残留肿瘤,在肺癌中表现不足,主要用于纵隔定义完全切除。国际肺癌研究协会(IASLC)分期委员会完全切除分委员会在广泛查阅文献后,基于国际共识提出了完全切除的定义[110完全切除需要以下所有条件:显微镜下证实自由切除边缘;系统性淋巴结清扫或叶特异性系统性淋巴结清扫;肿瘤无囊外淋巴结扩张;切除的纵隔最高淋巴结必须是阴性的。如果有切除边缘、囊外淋巴结延伸、未切除的阳性淋巴结或阳性胸膜或心包积液,则定义为切除不完全。当切除边缘游离,无残留肿瘤,但切除不符合完全切除的标准时,即为癌原位在支气管边缘,或胸膜灌洗细胞学阳性,术语不确定切除被提出。R1定义为微观肿瘤组织的持续,R2定义为宏观的不完全切除。
R0在NSCLC中的预后作用的证据水平相对较低。有许多研究来自II期和手术系列的回顾性分析,主要包括IIIA-N2期NSCLC。在大多数病例中,无论是单变量分析还是多变量分析,R0都是生存的预测因素。我们发现只有一项III期试验在多变量分析中将R0作为次要终点进行评估[102].在154例接受诱导化疗后手术的IIIAN2期NSCLC患者中,R0是生存的独立预后因素,中位生存期为24 (R0)。与12个月(R1/R2)。在多变量分析中,对于少数大的系列,包括病理I-IV期NSCLC患者,不完全切除被报道为生存的不良预后因素。受累切除边缘与死亡风险增加相关(危险比1.49;p<0.001)在挪威登记的3211名患者中[111].在另一个836例患者的手术系列中,R1/R2与R0病例相比,观察到风险比为8.2 (p<0.001) [112].在446名患者中观察到死亡风险增加了一倍或三倍(p<0.01) [113].
IASLC报道了近期最大规模的研究,评估了病理性TNM在9137例切除NSCLC中的预后作用。在多因素分析中,使用IASLC提出的第七版的病理分期是生存的重要预后因素(p<0.0001) [114].在超过500例患者的大型系列或注册研究中,pTNM [111,115- - - - - -117]分别分析时,pT或pN [112,118,119],被发现与生存率独立相关。最后,六项随机试验评估术后辅助化疗的作用,并在预后因素分析中考虑病理分期,发现pTNM、pT或pN是生存的重要预测因子[120- - - - - -125].在这些研究中,最常用的是UICC和美国癌症分期联合委员会系统的第五版,尽管有三项研究应用了第四版。
建议
1)完全切除是NSCLC切除后生存的预后因素,可作为总生存的中间标准。证据水平:队列和回顾性研究;证据质量:3;推荐等级:Fs。
2)病理性TNM是影响切除术后NSCLC生存的预后因素,可作为判断总生存的中间标准。证据水平:队列研究;证据质量:3;推荐等级:Fs。
声明
建议采用IASLC完全切除分委员会提出的完全切除定义。
问题7:代谢反应能否通过18正电子发射断层扫描f -氟脱氧葡萄糖的聚集(18F-fdg-pet或pet-ct),预测化疗的疗效?
在对文献的系统回顾和荟萃分析中[126,127],原发肿瘤SUV马克斯衡量18F-FDG-PET已被证明对NSCLC有预后价值。这一观察结果需要通过考虑已知预后因素的多变量分析来证实;然而,这强烈表明PET可能比仅提供成像更有用。
PET已被提议用于评估化疗反应。标准由EORTC PET研究小组于1999年定义[128].一个完全的代谢反应是完全的解决18在肿瘤体积内摄取F-FDG,使其与周围正常组织难以区分。部分代谢反应包括一个化疗周期后肿瘤SUV减少至少15%,一个以上治疗周期后减少超过25%。肿瘤摄取程度的降低并不是部分代谢反应的必要条件。稳定的代谢性疾病是肿瘤SUV增加<25%或减少<15%,且肿瘤摄取程度无明显增加(最长维度为20%)。进行性代谢性疾病包括基线扫描确定的肿瘤区域内肿瘤SUV >增加25%,肿瘤摄取范围明显增加(最长维度为20%),或转移性病变中出现新的FDG摄取。对于专家来说,25%被认为是一个有用的分界点,但需要进行可重复性分析以确定统计显著性的适当分界点。10年过去了,这种分析还没有进行。
在这一背景下,肺癌的数据是有限的和不同的。一些小型研究评估了代谢反应对进一步生存的预测作用。在一系列57例接受化疗的晚期NSCLC患者中,SUV的变化已被证明与肿瘤/肌肉比率的变化具有相对类似的充分性,并且优于净内流常数的变化[129].在另一组51例NSCLC患者(15例接受诱导化疗,31例接受姑息性化疗)中,根据EORTC标准评估的代谢反应与生存期的显著差异无关,而根据SUV的中位数变化将患者分为两组时,代谢反应变得显著[130].在30例IIIAN2期NSCLC患者中,诱导化疗的最佳截断点是SUV的降低马克斯预测5年生存率为60%;减少25%并非歧视[131].在一项系统的文献综述中,关于预测诱导治疗的III期疾病的组织病理学反应和进一步的生存,德G欧盟- oei等.[132]显示,在SUV使用的截止时间和病理反应的定义方面,研究存在很大的异质性。在上述系列报道中,Dooms等.[131]结合病理(pN0或pN2在纵隔淋巴结中癌细胞<10%)和代谢(>在原发肿瘤中SUV max降低60%)标准定义了预后良好的组。最后,在31例III期NSCLC患者中,完全(但不是部分)代谢反应与更好的生存有关[133].
初始SUV的预测效果马克斯一篇关于晚期NSCLC(87例患者)的论文的主题是原发性肿瘤对化疗的形态学反应[134].运动型多功能车马克斯(中位数二分)是单变量和多变量分析中唯一显著的预测因子,但高SUV患者马克斯反应持续时间更短,且高和低SUV患者的总体生存期没有差异马克斯.
两项小型研究已经对第一疗程化疗后代谢反应的早期评估进行了调查,这表明在预测进一步生存方面有一些潜在的用途[135,136].
通过代谢反应预测形态反应的研究已在两份报告中描述。在第一项研究中,代谢反应被证明具有很高的预测价值(96%),这意味着,如果PET扫描没有显示出反应,则不太可能通过形态学测试记录[129].阳性预测值不是很好(71%)。在第二项对89名患者进行的研究中,代谢反应(无论是视觉反应还是基于SUV的反应)之间的相关性马克斯),形态反应较差,SUV马克斯化疗后的测量不能预测进一步的生存[73].我们还必须考虑到由于缺乏标准化而可能出现的方法问题。
建议
PET扫描评估的代谢反应不应取代形态学标准用于肺癌患者治疗反应的常规评估。证据水平:回顾性研究和病例系列;证据质量:1;推荐等级:哦。
语句
EORTC为代谢反应提出的定义反应/进展的分界点为25%,需要进行验证评估。
代谢反应需要在PET扫描检查标准化、形态学反应评估和结果定义等方面进行严格的研究。
问题8:组织生物学标记物在评估总生存率方面的作用是什么?
已经在肺癌中测试了许多生物标记物,用于预后或预测对化疗或放疗的反应。确定组织生物标志物的存在或不存在可以通过各种技术(免疫组织化学,PCR,荧光原位杂交和高通量技术,等。),在不同水平上评估癌症生物学:蛋白质表达、RNA或DNA异常。问题是,在治疗期间,例如化疗前后,组织生物标志物的差异表达是否可以可靠地预测治疗疗效和总生存期。
许多关于肺癌组织生物标志物的研究已经发表。他们研究了这些生物学标记物对生存的预后作用,这些标记物通常在初始诊断时获得,主要在NSCLC手术系列中。在较小程度上,研究了它们对治疗敏感性的预测作用。然而,我们发现只有一项已发表的研究评估了治疗期间组织生物标志物的改变与总生存率之间的关系[137].54例III期NSCLC患者接受诱导化疗,随后伴随放化疗,如果肿瘤可切除则进行手术治疗。新辅助治疗前后细胞凋亡指标无差异,对生存期无统计学影响。
缺乏研究的一个潜在解释是,很难从肺癌患者身上获得足够的组织样本。当观察到良好的反应而没有手术计划时,这个问题会更加明显。
建议
组织生物学标记物不应用于评估治疗疗效,也不能作为肺癌患者总生存期的适当中间标准。证据级别:病例系列;证据质量:1;推荐等级:哦。
语句
组织生物学标记物在评估肺癌患者总生存期中的作用需要进一步研究。也就是说,在阳性定义方面,以及评估方法和统计方法的标准化(考虑已知预后因素的多变量分析)。
问题9:循环标志物(分子或细胞)在评估总生存率方面的作用是什么?
我们的目的是确定肺癌患者治疗前后循环标志物水平的改变是否能可靠地预测总生存期。我们按照方法学部分的描述选择了标记。我们还专门寻找了被称为非小细胞肺癌或SCLC潜在预后因素的生物标志物:乳酸脱氢酶、碱性磷酸酶、白细胞和中性粒细胞计数、血小板计数、血红蛋白血症、钠血症、钙血症、胆红素血症、cyfra 21-1、癌胚抗原(CEA)、神经元特异性烯醇化酶(NSE)、胃泌素释放肽(pro-GRP)和其他癌症标志物,如CA19-9和CA-125。如果评估了标记物与总生存期之间的相关性,则出版物符合条件。
虽然初步诊断时所选变量对生存的预后作用已被广泛研究,但很少有研究总结在表8,已发表的研究评估了其在治疗前后表达对生存的预后作用[138- - - - - -141,143,144,146- - - - - -153].作者根据循环标志物水平定义反应的标准是可变的,只允许在研究之间进行间接比较。必须指出的是,在这些研究中,大多数是回顾性的。
治疗后CEA正常化或显著降低似乎与手术治疗早期NSCLC患者更好的生存有关[138,140- - - - - -142],在接受化疗的晚期非小细胞肺癌[139,143],以及在挽救吉非替尼治疗复发NSCLC后[144].在两项研究中,Cyfra 21-1的降低已被报道与生存率的提高显著相关[139,143]而在第三个研究中没有观察到任何关联[146].对于其他因素,小型研究可以表明,以下血液水平的降低预示着更好的生存:SCLC中的pro-GRP,复发NSCLC中的CA19-9, NSCLC中的CA-125, NSCLC和SCLC中的NSE [143,144,147- - - - - -149].在两项针对NSCLC和SCLC的大型研究中,化疗或放化疗期间发生的贫血未被证明具有预后意义[150,151].最后,循环肿瘤细胞在血液中的持久性在放化疗治疗的局部NSCLC和吉非替尼治疗的复发NSCLC中具有预后意义[152- - - - - -154].
建议
1)部分循环标志物(CEA、Cyfra 21-1、pro-GRP,以及少量的NSE、CA-125、CA19-9)作为评估肺癌患者总体生存的单一标准,可作为肺癌患者生存的适当中间标准。证据水平:回顾性研究;证据质量:2;推荐等级:Fw。
2) NSCLC中循环肿瘤细胞的持续存在可能对进一步生存有预后影响。证据水平:队列研究;证据质量:1;推荐等级:Fw。
声明
循环标志物在评估肺癌总生存期中的建议作用需要进一步的前瞻性研究,采用适当的方法(包括截止测定),即在统计学方法方面(考虑已知预后因素的多变量分析)。
结论
总生存期,或可治愈疾病的愈合,是肺癌患者治疗效果的主要标准。中间标准是潜在的或适当的生存替代品,尽管存在一些局限性:TTP、PFS、客观缓解、放疗后局部胸控、手术前诱导治疗后局部晚期NSCLC纵隔和TNM降期、切除术后NSCLC完全切除和病理TNM,以及一些循环标记物(CEA、Cyfra 21-1、pro-GRP以及较小程度的NSE、CA-125和CA19-9)。目前,一些标准不能用于预测肺癌的总生存期(因此肯定不能作为总生存期的替代品):原发性肺肿瘤放射治疗反应评估的常规标准,治疗期间的生活质量演变,FDG-PET扫描代谢反应评估,以及组织生物学标记物。本研究的建议强调,在许多情况下,中间标准可能是有兴趣的,需要精心设计的前瞻性研究。
潜在的限制和问题
文学的偏见
首先,我们寻找前瞻性研究和元分析,作为主要目标,寻找中间标准和总生存期之间的关系。B最近讨论了这种方法uyse[155来证明替代品和临床终点之间的可能关联,需要来自多个随机试验或荟萃分析的数据。在这些指南中考虑的大多数情况下,这方面的文献是缺乏的。其次,我们寻找前瞻性研究和回顾性研究的次要终点。虽然我们为每个主题使用了多个关键词,并使用了广泛的文献搜索系统(Ovid),但有可能一些研究和系列中所选的一些标准实际上被报告为次要终点,但没有检索到。然而,这种文献偏倚对这些指南结论的影响似乎有限,因为这类研究的证据水平相对较弱(根据grade系统,证据等级较低或非常低)。此外,纳入非随机研究应导致对文献结果的解释产生偏差,以评估客观反应和生存率等标准之间的关联。另一个潜在的偏差来源与所考虑的语言有关。我们只考虑用所有作者都能理解的英语、法语、德语和荷兰语撰写的报告。必须强调的是,大多数结果来自严格挑选患者的临床试验,并不能完全代表在常规实践中治疗的人群。
验证研究
尽管我们在荟萃分析和小规模随机研究中发现了中间标准和生存期之间的一些统计相关性,但在大多数情况下,在得出明确的结论之前,还需要进行验证研究。这些研究需要前瞻性设计,主要目标是确定所考虑的替代药物与真正终点之间的关系。正如我们用TTP观察到的那样,当预测生存的中间标准的影响仅占生存率变异性的有限部分时,他们必须考虑关联的临床价值[40,41].由于定义中间标准的问题或其他可能影响临床结果的因素,潜在的替代品可能有大量的噪声成分。因此,除了主张代孕的情况外,还有一些关于代孕的适用问题。这需要了解相关的生物学变量,即治疗或所考虑的人群可能会影响主要利益的结果。
建议的等级
为了对指南进行分级,ELCWP选择了grade系统。这个国际公认的分级推荐系统以前曾被美国胸科医师学会用于肺癌[156].GRADE有一定的优势。它允许根据科学证据的水平对建议进行分级,这进一步受到文献质量的调节(表1).它还允许指南作者将一些主观变量集成到建议的等级中,例如理想和不理想效果之间的平衡,以及价值和偏好或成本(资源分配),这在日常实践中可能很重要,但不能总是从文献中得出。
补充治疗对总生存期的影响
我们选择了评估代孕与总生存率之间可能关系的研究。研究治疗后的前期或后续治疗可影响总生存期,并可能影响与中间标准的关系。不幸的是,根据目前可用的数据,在我们的文献解释中不可能避免这种潜在的偏差。
视角
我们发现,中间标准作为肺癌替代终点的验证尚未真正实现;此外,这种验证可能取决于所考虑的治疗类别和试验中纳入的患者群体。新疗法的发展促使我们考虑使用中间标准来评估其有效性,以实现样本量、研究持续时间或成本的可能减少。在不久的将来,将提出一组基于基因表达或蛋白质组学平台数据的进一步中间结果。在这方面,考虑到生物途径可能影响治疗的有益或有害影响,进而影响最终结果,确定一组中间结果可能很重要。
为了令人信服地验证这些早期标记物作为替代品,必须开发一种严格的方法。B已经提出了一些建议uyse同事们[8,155]关于使用meta分析验证临床替代品和生物标志物。
致谢
作者隶属关系如下。T. Berghmans, I. Cs Toth, E. Markiewicz, A.P. Meert, C. Wachters和J.P. Sculier: Jules bordt研究所重症监护和胸部肿瘤科,Université布鲁塞尔自由图书馆,比利时布鲁塞尔;F. Pasleau: Bibliothèques《生命科学》,Université de Liège, Liège,比利时;M. Paesmans: Jules bordt研究所数据中心,Université布鲁塞尔自由书店,布鲁塞尔,比利时;Y. Bonduelle:比利时Verviers CH Peltzer-La Tourelle肺气科;J. Cadranel:肺气科,Hôpital Tenon, AP-HP, Université Pierre et Marie Curie,巴黎,法国;C. Garcia: Jules bordt研究所核医学系,Université布鲁塞尔自由图书馆,布鲁塞尔,比利时;V. Giner:西班牙瓦伦西亚萨贡托医院肿瘤内科;S. Holbrechts:肿瘤内科,Hôpital Ambroise Paré,比利时蒙斯;J.J. Lafitte和A. Scherpereel:里尔CHRU气压学系,Hôpital Albert Calmette,里尔,法国; J. Lecomte: Dept of Pneumology, CHU de Charleroi, Charleroi, Belgium; I. Louviaux: Dept of Medical Oncology, CH Peltzer-La Tourelle, Verviers, Belgium; M. Richez: Dept of Pneumology, CHR St-Joseph-Warquignies, Boussu, Belgium; M. Roelandts and P. Van Houtte: Dept of Radiology, Institut Jules Bordet, Université Libre de Bruxelles, Brussels, Belgium; Ch. Tulippe: Dept of Pneumology, Centre Hospitalier de Mouscron, Mouscron, Belgium; P. Van Schil: Dept of Thoracic and Vascular Surgery, UZ Antwerpen, Antwerp, Belgium; V. Westeel: Dept of Pneumology, CHU de Besançon, Besançon, France.
脚注
这篇文章有补充资料可从www.www.qdcxjkg.com
权益声明书
J.J.拉菲特和V. Westeel的意向书可在www.www.qdcxjkg.com/site/misc/statements.xhtml
- 收到了2010年12月10日。
- 接受2011年5月29日。
- ©2012人队