跳转到主要内容

标准在临床试验中使用omics-based预测:解释和细化

文摘

高通量“组学”技术,生成分子biospecimens已广泛应用于临床前研究资料揭示分子亚型和阐明疾病的生物机制,和在临床样本回顾性研究开发数学模型来预测临床端点。然而,这些技术转化为临床测试,可用于指导管理决策对病人相对缓慢。很难确定当身体omics-based测试是足够全面和可靠的证据支持声称准备临床使用,甚至是准备的评估在临床试验中,它可能被用来直接病人治疗。这个困难的原因包括探索性和回顾这些研究的本质,这些化验和他们的应用程序的复杂性临床标本,和许多潜在的缺陷发展的内在数学预测模型从高维数据生成的这些组学技术。这里我们提出一个清单的标准考虑当评估的证据支持的临床使用预测来指导病人治疗。标本和分析需求,包括问题过程的稳健发展预测模型,对临床研究设计和行为的期望,并注意监管,伦理和法律问题。拟议的调查人员准备检查表应该作为一个有用的指南建议的研究,涉及使用omics-based测试。美国国家癌症研究所计划参考这些建议审查指南的研究涉及组学测试,并希望其他赞助商也会采用检查表。

同行评审报告

组学分析治疗决策的承诺

高通量“组学”技术可能让更多的疾病信息特征更好地预测个体病人的临床过程和受益的程度他或她可能来自新的和现有的疗法。潜在的疾病的详细描述已经会见了在肿瘤尤其极大的热情,在恶性疾病长期以来的异构特性提出了挑战。然而,尽管这些技术在临床的广泛使用和回顾性研究,它已被证明比预期的更困难的承诺转化为临床有用的测试,可用于指导管理决策。

本文侧重于分子测试来自高通量组学分析(“omics-based测试”或只是“组学测试”)中定义的医学研究所(IOM)报告平移的进化组学(1]。召开的一个国际移民组织委员会审查omics-based预测病人的测试结果在临床试验中定义了“组学”研究相关的生物分子以综合的方式。组学学科的例子包括基因组学、转录组、蛋白质组学、代谢组学、表观基因组学。此外,IOM委员会omics-based测试定义为“一个化验或来自多个分子组成的测量和解释一个完全指定的计算模型产生临床可行的结果”(1]。

这里讨论组学测试的特点是计算方法应用于高维数据建立数学模型,通常从一个子集的测量变量被确定通过数据驱动的选择。这是基于预先确定分子测试相比,生物驱动变量,如基因突变的新的治疗代理人的目标,这可能会被用来屏幕患者临床试验资格。虽然这些生物驱动的测试必须基于化验用适当的分析性能,他们不受所有相同的固有缺陷,在组学测试涉及复杂的计算模型,所以他们不是本文的重点。

从高通量组学技术的发展道路clinical-grade组学测试要求严格的注意标准包括以下:

可用性和适当的临床样本的质量

组学的分析性能试验要求

组学数据预处理的方法

数学预测模型的发展和评估它的性能

临床对测试结果的解释

临床试验的设计

伦理、法律和监管问题

癌症基因组学研究的丰富的数据,它可能看起来奇怪,相对较少的组学测试已经成功地实现这条路临床使用。在某些情况下,在临床试验中使用的组学测试,或者他们推广的常规临床使用,已经过早(1]。

原因有很多组学测试的不足,能够为患者和临床医生提供有用信息的评估和治疗疾病。它们包括难以获得足够数量的合格质量biospecimens所需的临床和病理特点,以及开发和实现的技术挑战化验,可以成功地应用于可用的类型的临床标本。最优分析性能和再现性的组学分析可能难以实现,或者分析缺乏辅助pre-analytical影响标本的鲁棒性。翻译也受到困难正确评估证据积累的身体一个组学测试的时候有兴趣在其确定的评估在临床试验中。组学研究常常没有足够的细节,使评估报告的严谨的测试是开发或评估。足够的数据和计算机代码并不总是可用,允许的理解方法用于测试或促进发展的独立复制的结果。细微的缺陷统计方法开发或评估数学模型可能未被发现的性能。必须考虑所有这些问题前临床研究使用一个组学测试的方式可能会影响患者的临床管理2]。

这里给出标准,应该确定组学的准备解决测试中使用的前瞻性临床试验或研究。这些条件适用于测试来自高维数据生成的任何类型的组学技术提出了这些测试时使用的一项研究中,会影响病人的治疗。标准地址不仅证据来支持一个组学测试的强度,还必须考虑实际问题,使用测试前在临床设置。评论伴随每个标准提供的理由和更具体的细节信息请求的类型。标准的成套组装到一个检查表,在表所示1

表1标准的使用omics-based预测在国家癌症研究所提供临床试验

这个清单适用于任何临床试验涉及临床实验使用的组学测试,会影响患者的临床管理试验,例如,治疗的选择。在组学测试的情况下将回顾性评估在宝贵的不可再生的标本收集患者前瞻性的临床研究,许多清单标准仍然适用,检查表可以作为一个有用的指南在判断预测开发过程的质量和证据的强度和可靠性。

本文的目的是作为一个带注释的同伴短版的发布在别处的这些指导方针(3]。而简短的文章提供了一个快速概述的检查表,其发展背景,和讨论的背景下,它的目的是被使用,这再阐明潜在的发展的基本原理进行更详细的标准。

这些都是一般的指导方针,它是意识到可能会有细微的差别在他们是如何应用于一个特定的组学测试和临床设置。组学的发展,测试通常通过一系列的研究中,它不可能解决所有的这些标准在早期发育的研究。理想情况下,调查人员应该咨询这个清单在研究计划和测试开发阶段,这样关键的证据是系统地获得和报道,测试准备的时候明确的评估在临床研究中,必要的证据取得全面解决标准。希望研究人员有用,因为他们会发现这清单准备背景材料研究的建议和临床试验协议。

样品的问题

  1. 1。

    建立样本收集和处理方法和适当的储存条件,确保标本是否适合使用组学测试。

许多因素可以改变样本的分子特征和影响标本的可用性,或从样品分析物隔离,一个组学分析4- - - - - -10]。组学技术的细腻敏感微妙的生理变化也意味着一些这些技术可以很容易地影响因素中遇到标本收集、处理和存储。标本或孤立的分析物可能会退化或其组学概要文件以意想不到的方式改变。的标本应该考虑整个生命周期,从主机的状况时首先获得标本(例如,病人已经禁食或麻醉)和包括的过程获得的(例如,手术切除,芯针吸活组织检查,静脉穿刺、骨髓愿望),处理方法(例如,snap-frozen在液态氮),稳定剂和防腐剂的使用(例如,乙二胺四乙酸,中性缓冲福尔马林),和存储方法(例如,-80°C,室温下,真空密封)。调查人员应该检查所有可用的数据对这些因素的发展研究中使用的样本组学测试或应该进行进一步的调查研究这些因素的影响在组学测试的性能。是很重要的文件,组学测试将执行令人满意的范围条件下的标本将获得并存储在典型临床设置;或者,更为严格要求标本收集、处理和存储测试之前应明确指定用于临床试验或其他临床验证研究。

  1. 2。

    建立标准筛选不足或质量低劣的标本或分析物从这些标本分离前进行化验。

在很多情况下不可能识别并记录所有的因素可能会影响标本的质量或孤立的分析物。可能需要作出决定的可接受性标本完全的基础上的可测量的特征样本。这需要标准样品质量小心为了符合样品或其指定适合测定的孤立的分析物组学测试。这样的标准也可能被开发和使用上除了规范标本采集、处理和存储。适当的标准取决于标本类型和要使用的特定的试验平台。组学分析基于RNA的RNA数量完整性(RIN;安捷伦科技)是这样的一个例子质量指标(11),虽然阈值可接受的质量可能依赖上下文。RIN通常被认为是一个有效的质量标准从冷冻标本中提取RNA,但是没有它的价值共识RNA提取formalin-fixed,石蜡包埋标本。数量的DNA碎片可能不是免疫组织化学和荧光的一个重要因素原位杂交分析应用于formalin-fixed,石蜡包埋标本,但组学分析可能不执行高度分散的DNA。在这种情况下,标准评估的程度的DNA碎片屏幕质量可能是一个重要组成部分。缺点的基础上决定样品可接受性只在标本或孤立的分析物的可测量的特征是,这种方法依赖于这些特征来捕获相关的先验条件的影响。

  1. 3所示。

    指定所需的最少的标本。

组学分析可能的性能密切相关(质量或体积)的标本量可用或目标材料的纯度。在许多情况下,标本是一个异构的构成感兴趣的细胞。例如,一个组织手术标本的癌症患者可能由肿瘤细胞坏死组织后,正常的上皮细胞,血液细胞、基质细胞、肿瘤细胞的存在稀释目标来衡量,并可能导致假阴性检测结果。有时分析物富集技术,如激光捕获显微解剖是用来丰富感兴趣的细胞(如肿瘤细胞)从whole-tissue标本。另一个常见的问题是广泛的骨髓吸入物与血液细胞污染。通常,会有标本质量和数量之间的权衡。例如,部分退化的DNA样本可能仍然是可接受的,如果总金额足以包含足够数量的高质量的DNA分子。一个广泛的适用性分析DNA, RNA和蛋白质提取核心针活检肾癌提供了一个示例的一个如何评估分析物的数量和质量,可以从一个特定类型的标本分离12]。标准应该建立不仅为起始的标本量,而且对靶细胞的纯度百分比或完整感兴趣的分析物。这些评估应由个人以适当的组织病理学方面的专长。

  1. 4所示。

    确定的可行性获得标本的数量和质量将产生孤立的细胞或成功所需的分析物测定性能在临床的设置。

很多组学测试开发与回顾性收集的标本可能已经预先选择的足够的数量和质量,因此可能不代表标本中可能获得的临床用途。它可能不知道这个预选。可能没有记录病人的数量来说,样本收集最初试图或尝试的数量是每个病人,直到这些尝试是成功或中止。某些标本可能是以前收集的专门研究环境中有足够的专业知识和资源来成功执行集合。患者的上下文中研究可能更接受标本收集和更加宽容可能入侵的样本收集过程,导致更大的成功在样本收集这些设置比可能会在常规临床设置。评估收集所需的数量和质量的可行性的标本在多中心临床试验或常规临床,可能需要进行初步可行性研究在更现实的临床设置。重要的是要建立组学测试足够强劲,将执行可接受标本可能遇到了在临床实践中。

分析问题

  1. 5。

    评估所有可用的信息使用的标准操作程序(sop)实验室执行组学分析的发展研究,包括信息技术协议、试剂、分析平台,分析评分,和报告方法,评估当前的可比性分析早期版本和建立的组学测试的各个方面明确锁定了最后的验证。

严格检查的价值分析的发展历史进行临床试验前往往被低估了。研究实验室特别是随着时间的推移可能修改他们的试验方法来提高检测性能,适应不断变化的成本或者可用性试剂,标本,或仪器。一组学测试前被认为是用于临床试验,试验方法和数据聚集在发展阶段应该仔细审查确定的版本鉴定潜在的组学测试提出了审判有望生成数据与那些前生成的版本(s)的测定。这是一个特别的挑战当使用组学测试利用商用芯片或其他快速发展的技术。这不仅评估应该包括的主要(原始的)数据生成的分析也任何评分法或解释规则(例如,积极的和消极的)也被应用。如果数据中生成多个实验室在开发过程中使用,还应该确定可比数据生成的不同的实验室。

完全指定的试验方法(见标准6)的一个关键方面是一个锁定的组学测试。附加要求锁定测试包括特定的样品需求(见标准1 - 3),指定详细的数据预处理指令,和一个完全计算预测模型(见标准14 - 23)。前组学测试试验中使用,它应该被验证在一个预先确定,锁定的形式。如果更改了任何方面的测试,必须建立,修改后的测试产生的结果是高度与那些之前的版本验证临床锁定的形式。

  1. 6。

    建立一个详细的SOP进行分析,包括技术协议、仪器、试剂、得分和报告方法,校准器和分析标准和控制。

试验协议应足够详细,以确保它的再现性。元素SOP应该具体到最小化结果分析时的变化表现在不同时期,在不同的实验室(如果多于一个实验室将运行测试),以及不同的技术人员。SOP应该不仅包括技术措施进行分析,仪器,试剂,得分和报告方法,类型的校准器和分析标准,控制,监控分析性能和质量控制程序,以确保内部和实验室内部再现性(见标准7)。避免使用模棱两可的术语“校准器”,“标准”,和“控制”,他们这里定义如下:

校准器是一个示例工程生产特定分析物和一个特定的值是用于校准曲线的发展从运行运行标准化试验值。

分析标准样品,已经广泛的特点,将产生一个一致的分析结果重复化验。

控制是一种生物标本,有足够的数量包括在多个试验批次监控试验性能潜力漂移;或生物标本,预计将产生一个明确正面(负控制)或负面(积极控制)的结果。

SOP应该关注预期的使用环境开发的临床试验结束后在社区或确认验证研究。参数具体为临床使用的可靠性和可行性,如最大周转时间,还应该指定(参见标准10)。确保适当的临床解释测试结果显然是传播,SOP也应该完全指定的格式的输出分析报告。

  1. 7所示。

    建立可接受性标准对试验批次的质量和结果从个体标本。

意想不到的技术问题可以发生在一个分析的过程中,产生异常的结果对个人或整个试验批次样品。质量监控体系应该来检测这些问题。例如,一组全面的性能指标提出了液体chromatography-tandem质谱系统的蛋白质组学分析(13]。可接受性标准可能专注于偏见或精度或两者兼而有之。控制样本,分析标准,盲目的复制样品,使用时,可以有效的检测工具分析问题和确保一致性的结果(14- - - - - -16]。推荐类型的控制,分析标准和复制,以及标准用来确定可接受性的测定结果,应该分析协议中指定。定期测量单个样本重复或一式三份还可以帮助识别不可靠的数据,尽管它可能不会有助于检测有偏见的读数。最后,这些程序还应该包括复制分析随着时间的控制和标准,确保时间组学分析的稳定性和孤立分析物在指定条件下的存储。这个问题是特别重要的前瞻性试验中病人权责发生制和样本收集和分析将发生在长期的时间。使用这些类型的质量保证和质量控制程序将增加信心化验结果,有助于防止严重的试验失败,可能会影响病人的治疗由测试结果。

  1. 8。

    验证分析性能通过建立分析指标如精度、精度、变异系数、灵敏度、特异性、线性范围、检测极限,量化和限制,适用。

前组学测试用于临床试验,分析试验的性能应该评估建立化验分析的有效性。这个评价应该检查性能指标,如精度、精度、变异系数、灵敏度、特异性、线性范围、检测极限,和定量的限制,适用于特定的测试研究。Tabb研究报告。(17]提供的例子的重复性和再现性的评估类型可以在蛋白质组识别液体chromatography-tandem质谱分析。一系列有用的指导文件和模板轮廓特征分析的最佳实践分析性能是可用的(18- - - - - -27]。

如果个体生物标记测量相结合(例如,作为加权平均),它可能是有用的了解个人的分析性能特征生物标志物进入组学预测模型的测量,特别是在模型发展阶段。然而,评估分析的特点,最终结果由测试组学是最重要的考试是进入在临床试验中使用。偏差或不精确的最终结果将直接影响病人护理指导的测试。例如,基因测试可能会产生一个持续的风险评分,计算的线性组合多个生物标志物测量。生成的最终风险评分的再现性这样的线性预测将取决于个人的偏见和精密的测量生物标志物和重量给每个生物标志物在风险评分。割点可能会被应用到翻译成临床分类的风险评分。最后的再现性临床分类将取决于风险评分的可靠性和风险的比例分数割点附近的集群。高可变性可以容忍风险评分时远离割点,因为最后的临床分类不太可能改变由于不准确的风险评分。特殊注意事项适用于预测模型,需要复杂的迭代或随机计算评估,与简单线性风险评分刚刚讨论的设置(见标准15和16)。

组学的分析性能评估测试应该进行的一组临床标本反映组合的预期范围的组件组学变量值。分析中使用的临床样本验证研究应该代表类型的预期的有针对性的临床标本,这些标本收集的和患者应包括光谱相似的病人来说,测试的目的是。

  1. 9。

    技术人员之间建立可接受的再现性和参与实验室和制定质量保证计划,以确保遵守一个详细的SOP和维护在临床试验测试结果的再现性。

出乎意料的测定结果的差异可能是由于特定的技术人员执行任何一步的分析,以及通过不同的环境或在实验室或临床网站标准实践。严格遵守详细安抚标本收集、加工、处理和分析程序可以大大减少组学检测结果由于这些因素的变化;然而,它不可能完全消除这种变化(28- - - - - -31日]。初步数据应该在技术人员提出了建立可接受的再现性,分析工具或平台,实验室和临床基地。因为实验室和临床工作人员和环境可以改变,随着时间的推移可能会添加新的临床基地,也是重要的质量保证计划和质量监控过程,以确保在验证的过程中都保持可比性研究或临床试验。推荐的程序可能包括初始培训和资格的员工,定期进修培训,使用盲法复制或控制标本直接评估测定结果的可比性和在实验室。如果测试是用来确定治疗,它必须被执行在临床实验室改进修正案(CLIA)认证实验室。CLIA-certified实验室通常有这些程序已经到位,尽管CLIA认证不会保证可比性在实验室当多个实验室参与执行分析的研究。

  1. 10。

    建立一个周转时间的测试结果在可接受的范围内用于实时临床设置。

omics-based测试是有用的在临床实践中,它必须是可行的收集和处理所需的标本,完成分析,生成并确认主要数据的有效性,计算预测,结果在一个可接受的时间内没有显著延迟通常的时间关于治疗或其他后续护理临床决策。因为许多omics-based测试开发和初步验证回顾标本收藏,在某些情况下,评估之前没有机会使用实时测试的可行性。可行性研究应该进行启动前的试验,以确保必要的基础设施和资源将会在收集和处理所需的标本根据指定的方法,将会有足够的能力在实验室进行化验,这可以实现及时数据提交和处理生成预测个体病人的审判。

模型开发、规范和初步的绩效评估

  1. 11。

    评估数据用于开发和验证预测模型检查的准确性,完整性和异常值。必要时进行回顾性验证的数据质量。

强烈建议的关键和独立的评估进行初步的质量数据用于开发和验证一个组学预测。与临床试验的数据,这通常是收集标准化和仔细的品质管理的条件下,在许多情况下数据用于开发预测是基于分析进行倾斜临床标本的临床和病理数据可能是组装从回顾评审记录。组学实验数据和临床和病理研究中使用的数据应该仔细审查对任何错误的证据,不一致,或从粗心造成的偏差或不完整的数据收集和临床注释。

在某些情况下,组学分析可能是由他人,只有组学数据,而不是标本,是可用的。在这些情况下可能会有小信息使用的标本或分析过程的质量。质量指标提出了某些类型的组学数据分析(32- - - - - -35),这些可以帮助识别潜在的问题。质量评估应该执行的主要组学数据从原始来源,如果可用,以及任何预处理数据确认没有错误在介绍了数据处理和处理。

一些组学数据问题可以被使用的简单的描述性统计。异常高的分子的两个不同样本之间的相关性可能表明一个意想不到的重复样品标签。合并来自多个不同的研究分析数据时,一个应该评估可能发生高样本之间的相关性是否有重叠的患者标本进行不同的研究。核酸检测,会发生交叉污染的标本和扭曲的基因变异配置文件。值得进行这些初步数据分析,以便识别和删除有问题的数据,增加对数据可靠性的信心。

临床和病理数据应该检查内部矛盾的证据(例如,复发死亡的日期后日期),极端的观察(例如,9岁的乳腺癌患者)或难以置信的数据组合(例如,男性卵巢癌患者)。极端的观察或不寻常的数据组合可以有很大的影响对预测的形式或其性能,因此应当服从验证如果可能的话。虽然它并不总是可行的确定极不寻常的数据是错误的,至少任何可疑数据的影响应该评估模型及其性能。

  1. 12。

    评估发展数据集技术构件(例如,影响试验批,标本处理、分析仪器或平台,试剂,或操作符),特别注意关注工件是否可能影响观察组学概要文件和临床结果之间的联系。

一些功能组学资料可以从工件出现介绍由于标本处理变化,测定试剂或仪器(36]。是很重要的检查这些构件的组学数据证据。标本处理或处理方法可以随时间变化或不同临床基地。随着时间的推移,实验室仪器可以漂移,试剂可以改变很多,和化验结果可以表现出独特的“批量效应”由于技术的变化、环境条件、操作符。技术平台(仪器、软件和试剂)可以成为过时了,要求更换新的版本。实验室信息管理系统可以用于跟踪这些因素,以便检测可能出现的问题和故障排除。虽然可以尝试纠正这些工件通过数据调整和/或使用复制的化验分析标准或校准器,这种调整往往不完全删除它们。这些工件的残余影响引入“噪音”数据,并可能降低组学预测的性能。

最好的防御线技术构件组学预测的发展阶段是质量监控和良好的实验设计,以避免混淆技术因素和重要的生物效应或临床结果(37]。例如,如果病人的标本反应无分别在不同的批次,一组学预测由这些数据只可能预测试验批,不是临床结果。这可以避免通过随机分配标本检测批次。其他形式的混杂也可以做得更隐蔽。如果病人应计在一个临床的网站往往更糟糕的预测比应计在第二临床网站,和两个网站过程标本不同的方式影响组学概要文件,一个组学预测由这些数据可能最终预测标本处理方法,为预测临床结果没有真实价值。只要有可能,标本处理标准操作规程应实施在所有临床基地这些讨厌的影响降到最低,避免混淆与患者预后特征随临床标本处理网站。如果它是不可能标准化程序,或者使用现有标本的集合(可能来自多个临床基地的应计),重要的是要证明,也许通过多变量统计分析,组学预测有能力预测结果在每个临床网站和调整后对其他标准的临床或病理变量。

工件和混杂因素组学研究中经常遇到的,因为它常常需要跨多个临床基地池或多个数据集收集一套足够大的情况下的组学数据和临床和病理数据构建或初步验证组学预测。调查人员首先收集标本,这些标本上执行组学分析应共同努力记录标本信息处理和辅助分析变量如试验批标识符,以便统计分析可以执行检查他们的影响力在组学概要文件。不幸的是,这对许多回顾性数据集信息不可用。但是,如果它有时可以得到部分恢复的主要组学与分析软件系统产生的数据文件打包平台是可用的。根据组学分析平台,其中一些信息可能是嵌入在主数据文件。例如,标题行Affymetrix GeneChip玻璃纸文件包含日期和经常实验室或操作符的信息。这些未知的潜在损害因素影响组学的性能预测凸显了需要外部验证组学预测用于指导病人护理。

  1. 13。

    评估适合的统计方法用于构建预测模型和评估它的性能。

高维度的组学数据和复杂的许多算法用于开发组学预测存在许多潜在的隐患,如果不使用适当的统计建模和评估方法。各种统计方法和机器学习算法可用于开发模型,和每一种都有其优点和缺点38,39]。没有统一的最佳算法开发一种预测模型(40]。最早的研究比较几种方法的发展预测从基因表达微阵列数据显示,对角线简单线性判别分析和加权方法执行,或者比发达与各种更复杂的方法在多个数据集(41]。随后的微阵列研究的质量控制协会(42)相比,预测由36个独立团队分析六个微阵列数据集开发预测13癌症和毒理学端点。研究得出的预测的性能很大程度上取决于端点和团队开发能力和不同方法生成的模型相似的性能。的更复杂的建模方法,特别是那些涉及正规化(约束的复杂性方法模型)和优化特征选择(43),理论上有可能产生性能预测。然而,他们需要应用复杂的工具,由技术熟练的手。在组学变量的数量远远超过的情况下独立学科或标本的数量,从比较研究现有的证据还没有令人信服地证明了高度复杂的建模方法的优势。

组学文学的一个普遍问题是算法开发预测通常是应用天真,和有缺陷的方法被用来评估预测的性能(40,44,45]。算法越复杂,就越可能会误解或错误地应用在没有经验的手中。两个最常见的陷阱在发展预测和评估他们的表现模型过度拟合和未能保持严格分离的数据用于构建预测模型和数据用于评估预测性能。这两个缺陷发生在大量的发表论文声称已经开发出组学预测性能较好(44,45]。很多组学预测的结果是失败时,一个真正独立的测试数据集(46,47]。

过度拟合发生在一个统计模型描述随机误差或噪声,而不是潜在的关系。建模策略,允许非常复杂的一个或多个自变量之间的关系和依赖(结果)变量和模型,由大量的变量尤其容易过度拟合,因为他们可以夸大数据波动很小(40]。组学数据,变量可用于建立一个预测通常远远超过的数量取得了独立的学科来说,组学分析数据;因此,潜在overfit模型高维组学数据可以是巨大的。开发研究的组学预测等比较端点生存,观察事件的数量(例如,死亡)是一个安装的可靠性模型的主要决定因素。诊断研究旨在建立一个预测疾病状态或类(例如,癌症或没有),患者的数量最少的流行类最强烈地影响开发可靠的诊断模型的能力。建模方法,包括正则化约束模型的复杂性,限制个人的影响变量或观察尤其有助于减少潜在的过度拟合。在选择候选模型中,重要的是使用适当的程序来评估模型的性能,以防范错误地选择一个overfitted模型。Overfitted模型通常会有糟糕的预测性能的新数据集。

验证模型的性能在一个完全独立的外部数据集是最优的,但可以在所需的模糊程度的独立性。最强的独立外部验证,收集的标本应在预定条件下在不同的网站,并根据最终化验应该进行SOP在不同的实验室和由不同的实验室人员。如果足够数量的患者或标本集都是可用的,一系列的验证可能会执行一个额外的因素是不同的在每个连续验证试图系统地建立鲁棒性的组学预测这些条件。显然是很重要的描述每个验证是未遂的条件,这样的力量可以评估每个验证适当的上下文。

并不总是有可能获取外部数据收集下确切的目标临床和会议的所有质量标准最严格的一种验证。在某些情况下,可能存在一个外部的数据集,但标本或试验协议可能不完全匹配那些组学用于测试;在其他情况下,临床可能过时,例如,因为标准治疗实践已经发生了变化。在这种情况下,一个人必须依赖于使用的模型开发技术旨在避免过度拟合,和一个只会让性能评估内部数据集用于构建模型。

绩效评估基于重用的数据用于模型构建信息只有当使用适当的内部验证策略。尽管标准化的化验和试图避免模型过度拟合,预测模型将几乎总是更好适应数据用于开发它,而不是完全独立的数据。高维模型建立的组学数据,简单的“插入”预测完全相同的数据被用来构建它为了估计预测的性能——所谓的resubstitution估计结果在一个高度乐观偏差估计的性能(40,45]。Resubstitution估计的性能预测建立高维组学数据是无法翻译的,不应该报道。不幸的是,resubstitution估计模型的性能仍然可以发现在一些文章发表。适当的替代天真resubstitution方法是可用的和应该用于内部验证。

的指导原则如何避免乐观地预测性能的偏差估计是从来没有估计预测的性能通过使用数据被用来推导出预测模型。最简单的方法,以确保分离的模型构建和评估是完全独立的培训和验证数据集,这样可以执行外部验证。最严格的外部验证:

要测试的预测必须完全锁定,必须有一个先前指定的性能指标。锁定包括所有步骤的数据预处理和预测算法。

独立验证数据应该来自标本收集在不同的时间,或在不同的地方,根据预先确定的协议。

验证样本集的分析应该在不同时间或不同的实验室运行但根据相同的试验协议是用于训练集。

个人发展预测验证数据必须保持完全失明。

验证数据不应改变基于预测的性能。

后预测不应调整其性能一直在观察到的任何部分验证数据。否则,验证可能需要妥协和一个新的验证。

内部验证可以在没有外部验证集可用,也有助于使用在模型建立阶段生成模型的初步估计性能监控和防止过度拟合。原始数据集可以被分成“训练”和“测试”(子集48]或各种数据重采样技术可以用于迭代构建的预测模型对部分数据和测试剩下的部分。

Split-sample验证,一个数据集分成两个部分,的优点是计算简单。它还提供了所需的灵活性使主观决策模型建立过程中培训的部分数据。作为split-sample进一步检查模型性能验证,可以交换的训练和测试子集来评估是否使用每个子集构建的模型有相似性能的子集(42]。有时被看作是一个数据集可能实际上是一个融合的几个小集。不同部分的数据可能代表的组学数据生成在不同的实验室或在不同临床标本收集网站。即使所有的实验室和临床基地遵循一个共同的协议样本收集和组学分析,可能会出现细微的差别。在这种情况下,最具挑战性的split-sample验证,最“真实世界”的代表,是分区数据为训练集和测试集最小化重叠在实验室或临床网站代表了两套。split-sample验证的一个缺点是效率太低。这是因为只有一小部分数据是用于构建预测模型。Split-sample验证应用于小型或中等规模数据集往往产生偏见的结果,因为它低估了模型的性能,可以使用整个数据集。

重采样方法优于split-sample验证,他们使用完整的数据集,但是迭代选择部分数据作为训练集,以便在迭代结束时,每个案例已经在至少一个子集训练子集和至少一个验证。重采样方法的例子包括各种形式的交叉验证(例如,分析,k-fold通常k = 5或10)和引导。重采样方法的最佳选择为特定问题取决于数据集的大小和所需的偏见之间的权衡性能估计和方差的性能估计(49]。

内部验证有两个主要的局限性。首先,如果研究的情况下选择并不代表人口预期用途或有技术构件影响整个数据集,数据的任何子集将继承这些同样的问题。尤其关注的偏见时从技术混淆的工件之间的关系感兴趣的组学概要文件和临床的端点(例如,良好的临床结果患者标本中运行一个不同的试验批患者比不利的临床结果)。这可能导致偏见的估计无法检测的测试性能,除非完全独立的数据集上的测试是评估不受这些同样的问题。第二,迭代重采样方法仅适用于如果流程用于构建预测模型完全算法,不需要主观判断。主观判断可能和巧妙地进入构建预测模型的几个方面。这些方面可能包括关于约束的决策模型中变量的数量,限制重量给任何单一变量,如何处理不寻常的测量,如何总结冗余变量,设置割点分数为临床决策风险。虽然很多这些方面可以完全算法的方式决定,许多调查人员不愿依靠完全自动化的模型构建方法。

训练集和验证集的分离的原则可以违反了在一些更微妙的方式。有时调查人员使用split-sample方法和发展预测模型只使用一部分数据,然后现在的模型性能估计合并后的训练集和验证集而不是验证设置,将是适当的。这仍然会导致一个乐观偏见的性能评估,因为由此产生的性能估计是一个混合的乐观偏见resubstitution估计在训练数据和一个独立的估计验证数据(50]。另一个常见的错误应用迭代重采样时验证方法是执行的初始屏幕组学变量使用整个数据集来确定这些变量单变量的大部分信息预测感兴趣的临床结果,然后进行迭代重采样以适应预测模型只使用所选变量的子集。由此导致的信息泄漏的初步筛选的完整数据集可以大量减少变量的数量,可以导致性能估计乐观偏见resubstitution估计(几乎一样大40,51]。

其他实践引入偏见的报道性能预测模型包括选择性包含或排除某些情况下训练或验证集获得更好地估计预测性能,测试性能在多个病人子组内的全部人群中,并在多个模型建立策略训练集,然后报告只有一个,得到最好的性能估计验证集。所有这些做法都是多个测试的例子,他们会导致虚假的发现和乐观偏差的估计报告预测性能。

令人遗憾的是,许多论文发表在著名期刊上报告组学发展良好的预测性能使用有缺陷的方法,评估预测性能如只是讨论。因此,发表在同行评议的杂志上发表不应视为保证组学预测的性能已经得到证实。发表文章应该批判性的回顾了方法的可靠性。如果没有提供足够的信息方法在发表的文章中,它可能是必要的为获得这些信息直接从预测开发人员,以及任何主要数据和计算机代码,需要独立繁殖前的预测开发和验证结果组学预测用于直接治疗的临床试验。

  1. 14。

    预测算法的建立,包括所有数据预处理步骤,割点用于连续变量(如果有的话),和方法分配预测,信心措施是完全锁定(即完全指定)和之前相同版本的性能要求。

大量的步骤发生的主要组学数据生成从标本,直到从组学预测最终结果产生。这些包括数据预处理步骤,如整体数据质量评估,排除不可靠的测量数据,数据标准化,计算中间摘要统计信息(例如,计算能够总结表达水平在微阵列数据)从探针强度值,计算得分(可能受到临床决策的割点),或预测的结果。报告测试结果的标准化格式应该开发,以确保适当的临床解释。报告的元素可能包括一个连续得分(例如,疾病复发的概率)或离散分类(例如,疾病亚型)或者两者兼有,也许伴随着某种程度的信心或统计不确定性区间的结果(例如,强阳性,模棱两可,不确定性风险评分±10%),推荐临床操作(例如,考虑辅助化疗,禁忌药物类)。

在组学预测在临床中使用会影响病人的治疗,所有方面的数据处理和预测计算和报告应该记录在一个详细的,过时的SOP文件,应该从他们的形式保持不变时,预测成形的基础临床测试是锁定最后的验证。改变任何这些步骤,包括调整割点应用于持续的风险分数,可以改变预测的性能特征。这种变化可能需要一个新的验证之前的预测是用来直接病人护理,除非其他的结果,例如,从一个试验桥接研究,能提供令人信服的证据表明,预测的性能没有负面影响的变化。一些可再生的研究软件和数据管理系统,可以帮助文档构建和验证预测的过程现在可用(例如,访问可再生的研究52],GenePattern [53],Sweave [54],knitr [55与Rstudio[],减价56],git [57])。实现完整的透明度在组学测试开发过程,应提供原始数据审查,应确定数据源。评估执行评估数据质量,并检查技术构件应报告。计算环境(语言、软件版本、图书馆、硬件和cloudware)应该被识别,和编程脚本用于数据预处理(例如,归一化)和模型开发和测试也应该用于审查。公共访问所有上述是可取的,但至少,这些物品必须由发起人用于审查和相关监管机构提出了试验的组学预测是使用。

  1. 15。

    文档来源的变化,影响最终的再现性的预测,并提供估计的整体可变性以及验证预测算法可以应用于一个案例。

一组学检测结果之间的关系和临床结果测试旨在预测将减毒如果测试过程缺乏再现性。测试结果对于一个给定的个人可以改变的原因众多,包括生物标本的异质性(例如,不同的克隆亚种群的细胞或肿瘤坏死区域),标本处理的变化,技术的变化分析,预测算法的数值变化。其中一些变异的来源可以控制和其他人不能。生物标本内异质性无法控制,但是它必须被理解。如果有大量的生物学异质性不能确定的,一分或地区的标本提供了大部分的组学信息与临床结果(例如,肿瘤的前缘,等级最高的肿瘤,或干细胞舱),然后组学测试不太可能会产生临床可再生的和有益的结果。变化由于标本处理和分析技术变化是最好的安抚通过仔细控制规范和质量监控。数值的变化预测算法可以通过选择控制算法或算法的设置。多个再现性评估可能需要完全理解所有这些变异来源的相对贡献的整体变化的预测,可以获得一个给定的个人。

再现性评估应足够详细地报道允许其他人理解变化的来源被评估。例如,两个独立的部分独立的肿瘤被分析物提取过程(例如,信使rna提取肿瘤标本),试验过程(例如,基因表达微阵列分析),并预测算法将展览可变性比复制单个样本的化验分析物提取分离和贯穿组学分析过程和预测算法。研究应进行评价组学检测结果变化的鲁棒性标本收集、处理和存储如果严格控制这些因素不指定为测试过程标准操作规程的一部分。标本用于再现性研究应该与临床样本,利用组学检测被提出。因为可能会获得更高的可重复的结果在细胞系或人工提取标本已精心准备在实验室环境中比在实际临床样本收集在难以预测的情况下,变化评估在细胞系或其他派生标本可能大大低估了可变性可以临床实践经验。

预测的变化由于数值算法,数学评估模型是最简单的评估。这种变化可以评估独立于生物和化验技术变化,但它仍然会导致整体的变化预测对于任何给定的个人。这个数值变化时只对预测模型无法评估作为一个简单的公式,需要评估迭代或随机计算机算法。稳定的计算机算法时要产生高度相似的结果完全相同的主组学数据用于独立的场合作为模型的输入。通常计算机算法是必需的,因为评价预测模型涉及到复杂的数学方程式,可以解决只有通过使用迭代数值近似。例如,马尔可夫链蒙特卡罗方法是迭代数学算法通常用于贝叶斯统计建模方法(58]。其他预测建模方法需要一个计算机算法相结合,因为它们涉及许多模型或决策算法,每个组件模型或算法只使用一个随机选择的病人数据的子集(例如,随机森林59,60])或只使用随机选择的一个小子集变量中大量可用的变量(例如,猎枪随机搜索61年])。在这些情况下,与迭代计算相关联的任何变化或随机分量模型选择是纳入最终的预测的可变性。根据特定的算法和数据集的算法,有可能是随机性引入的计算机算法是相当可观的。这种可变性成为变化的试验结果,必须评估以及化验分析性能(见标准8)。有时这种不稳定性可以通过锁定等措施解决迭代数值算法所使用的随机数种子或保存信息的组件模型,组合成一个最终的模型。如果数值变化的最终结果不能充分控制,那么这些复杂的模型并不适用于临床预测,预计相同的一组观察组学变量应该导致最终试验结果一致。

许多研究的组学预测开发利用数据预处理数据的预处理方法,诱导相互依赖关系或预测了标本的集合。这发生的一种情况是当预处理或预测算法应用于单个标本取决于其他标本处理发生。举个简单的例子,当这种依赖可能发生当每个测量变量集中减去该变量的平均值计算在标本的集合。一个更复杂的例子是广泛使用的健壮Multi-array平均计算方法能够总结的探针集Affymetrix GeneChip系统[62年,63年]。的Multi-array平均法包含一组微阵列数据适合模型,包括估计探测特定敏感性方面,它用于生产能够总结为每个探针集Affymetrix GeneChip。实施临床试验中患者个体随着时间的推移,将应计试验方法要求集团处理组学概要文件必须修改,以便处理一组学概要文件。一些调查人员解决这个问题通过使用一组固定的参考组学资料,每一个新的组学概要添加,然后删除的数据预处理(64年- - - - - -66年]。

一些早期识别肿瘤亚型的方法,比如内在乳腺癌亚型(67年,68年)或亚型弥漫型大b细胞淋巴瘤(69年),使用聚类的方法。这些集群有预后意义除了生物学意义,但为了适用于单一标本个体病人的分类,预测算法开发。聚类算法用于识别亚型可能产生的结果是敏感数据预处理方法,如变量定心和可能依赖的特征处理的样本集合在一起(70年]。因此,开发预测模型具有可靠地识别亚型,而无需使用聚类方法或其他方法需要处理一组标本为了使预测一个案例。例如,风险预测模型被开发成临床测试,可以诊断为一种内在的乳腺癌亚型为单个病人肿瘤样本(71年]。的基本原理是,一个应该能够执行的所有步骤的组学分析和预测算法来生成结果对于一个给定的样本不考虑其他标本同时被评估。

  1. 16。

    总结的预期分布预测病人的人口预测将被应用,包括任何信心指标的分布与预测。

很多组学预测开发现有的数据集或回顾性收集的标本。情况下包含在这些研究并不一定构成一个代表性样本的临床人口的组学测试的目的是,或从任何明确的人口。有时情况下故意选择使有过多的代表极端的临床结果(例如,非常短期或长期的幸存者)。在其他情况下,收集的病例研究非代表性是由于其他实际的约束条件,如获得同意的能力,病人的重要地位,或标本的数量。此外,一些预测指标与每个预测关联算法产生一个信心,这可能涉及,例如,邻近的预测风险评分之前定义的割点临床分类。如果病人的标本用于预期用途并不代表的人口发展研究,预测的分布及其相关信心指标发展的研究可能不代表分布期望当测试应用于临床实践。如果预期用途的预测人口高度倾向于预测临床结果在另一个,或者如果许多预测相关的信心较低,预测可能没有一个足够大的临床影响是有用的。因此,评估这些发行版应该扮演一个角色在决定是否追求组学预测的临床开发。

  1. 17所示。

    任何研究报告评估的预测# x2019;性能来确定其相关性的设置提出了预测的临床使用。

许多研究报告组学预测进行验证,但“验证”一词是用在许多不同的方式。各种问题应该被要求评估的力量和相关性研究,声称有一个组学预测进行验证。有时技术验证已经完成表明另一种分析方法产生的测量与最初测量组学变量显著相关。尽管技术验证提供一些保证研究结果并不完全构件的试验过程中,他们不提供任何临床相关的验证。临床前系统的其他类型的验证,例如,药物敏感性实验细胞系,可能支持生物合理性,但是他们不提供临床验证。为一项研究提供临床验证,必须有一个预定义的和临床有意义的预测性能指标,和临床设置(例如,疾病类型和阶段,样本格式)必须类似于用途设置。

有完善的评估标准的性能模型用于预测风险72年- - - - - -74年),信息报告的研究和指导方针已经开发遗传风险的预测(75年]和预后[76年,77年)和诊断(78年,79年)标记。这些标准和指南适用于各种组学预测。具体性能指标的选择(例如,敏感性和特异性,积极的和消极的预测价值,c指数,接受者操作特征曲线下面积)(72年- - - - - -74年)和基准的性能水平必须达到目的将依赖于临床使用。组学测试用于筛选大量健康人口疾病(例如,血清蛋白质组学筛选试验对卵巢癌)必须有很高的特异性和阳性预测值,并计算其预测价值必须通过使用疾病流行,适合目标筛选人口(80年]。测试旨在预测复发的风险指导决定额外的治疗(例如,复发风险评分来确定早期乳腺癌患者做或不需要辅助化疗)应该有高灵敏度来确定疾病的病人会复发。证明预测的输出统计上显著相关临床端点,旨在预测是没有足够的证据可接受的性能的临床使用81年]。

  1. 18岁。

    评估临床验证的预测分析和统计是否严格和明确蒙蔽。

明确的证据时需要严格的验证预测提出了在临床试验中使用会影响病人的治疗。理想情况下,这应该是一个失明外部验证一个完全独立的样本集。要求严格的蒙蔽外部验证包括签署和过时的文档中指定的预测完全锁定的形式发布之前任何验证数据。这个文档必须包括所有方面的SOP组学分析,包括数据处理步骤和预测算法。致盲机制的临床结果的数据应该是,例如,控制第三方“诚实的中间人”或一个独立的统计和数据中心维护数据安全系统,符合美国食品和药物管理局(FDA)指南的临床数据维护计算机系统(82年]。如果外部验证是不可能的,因为,例如,没有适当的独立样本集可用,然后从内部验证现有的结果必须仔细评估以确定是否足够严格的内部验证提供合理的信心预测的性能。任何验证尝试的结果应报告无论结果是有利还是不利的。

  1. 19所示。

    搜索公共来源,包括文学和引文数据库、通信》杂志和撤回通知,确定任何问题提出了有关数据或方法用于开发预测或评估其性能,并确保所有的问题都被充分解决。

组学研究的前沿努力促进公共可用的数据,还有前所未有的共享计算算法和计算机代码。没有这种共享的数据和算法,大量的数据和许多与组学数据进行分析的复杂性会使它几乎不可能复制很多组学研究结果。有时,问题数据或分析方法当其他人试图重现结果使用公开数据,方法,或计算机代码。每当一个组学预测试验或其他临床中使用会影响病人的治疗,必须有透明度,这样任何担心数据的准确性和恰当的方法可以迅速和完全解决之前资源消耗预测的追求进一步发展,当然之前预测临床使用。

临床试验设计

  1. 20.

    提供一个清晰的声明目标病人的人口和临床使用目的预测,确保预期的临床效益足以支持其临床效用。

许多出版组学研究报告统计上显著的组学之间的关联预测结果和临床端点。尽管这样一个协会的存在可能建立的临床有效性测试,统计意义(例如,P> 0.05)并不总是转化为临床有意义的关联或提供临床上有用的信息。除非组学预测提供了新的信息,很容易解释和有用的医生和病人在治疗决策,资源的投资在发展中临床试验可能被浪费。建立临床实用程序,而不是临床有效性,必须有证据表明使用的测试可能会导致患者临床上有意义的好处之外,目前提供的护理标准(83年,84年]。

设计的临床试验确定的评估的组学测试必须首先明确声明的目标人口和临床使用。信息的预期分布测试结果在人口和预期效果的大小或受益于使用的测试应该从临床前聚集或回顾性研究。在这些信息的基础上,应该确定是否会是可行的设计足够规模的试验或临床研究证明临床效用。理想情况下,预期的大小受益于使用组学测试将从多变量分析估计是除此之外提供的知识标准的临床或病理因素。

  1. 21。

    确定组学测试的临床效用可以评估使用存储完成临床试验的标本(即潜在# x2013;回顾性研究)。

在某些情况下,候选人预后和预测组学检测现有的疗法可以有效地评估使用prospective-retrospective设计、组学的测试应用于归档完成试验的标本,结果与结果的数据已经收集了(85年]。这个设计需要分析的回顾方面事实上可以可靠地执行存储标本。“潜在”方面的设计是指审判的保健在一开始就以确保以下几点:

试验中患者代表目标的患者将受益于组学测试。

有一个预先确定的统计分析计划。

足够的标本可以从审判的情况下,代表群和预期用途的人口来满足预先确定统计的样本容量需求计划,和这些标本收集和处理条件下符合预期用途设置。

一般来说,两个prospective-retrospective研究产生类似的结果需要有信心,已经建立的临床效用测试。

  1. 22。

    如果需要一个新的前瞻性临床试验,评估哪些方面的预测已经经历了足够严格的验证,允许治疗决策受到预测结果;作业都是随机治疗,提供平衡的理由。

各种各样的设计提出了III期临床试验将生物标记(86年- - - - - -88年]。有三种基本三期设计选项,经常被认为是评估生物标志物识别的子群的能力的患者将受益于一个新的疗法。这些浓缩设计、分层设计和战略设计。在浓缩的设计,只有患者积极的生物标志物的随机标准或新疗法。这种方法可以回答这个问题是否biomarker-positive病人受益于新疗法,但它不能用于实证评估是否biomarker-negative病人可能受益。分层设计随机排列所有的病人,但分别进行随机化与每个biomarker-positive和负组织确保平衡治疗武器在每个组。这种方法提供了最大的能力信息生物标志物识别患者将受益于新的疗法。一个分层的设计不允许影响治疗一个病人接受的生物标志物。这可能是一种优势的情况有一些不确定性的力量有限生物标志物的表现因为有标本的生物标记发展过程中执行初步验证。战略设计随机排列的患者之间没有使用生物标志物(所有患者接受标准治疗,胳膊上)和一个biomarker-based战略biomarker-negative病人被定向到标准疗法和biomarker-positive患者定向到新的疗法。 A strategy design in the context of a single biomarker is particularly inefficient because patients who are negative for the biomarker will receive standard therapy regardless of whether they are randomized to use the biomarker. Due to this inefficiency, this strategy design is generally not recommended in a simple single-biomarker setting. Each of these designs has its advantages and disadvantages; the optimal choice depends on feasibility and what properties have already been established for the biomarker.

许多相同的原则讨论了三期试验也适用于二期试验。一些方法二期设计可能不同于第三阶段设计包括选择或早期的端点(例如,疾病进展或肿瘤反应)和非随机性的可能性(例如,单臂)试验(89年]。药物试验,二期设计结合生物标志物通常是不确定的,主要是屏幕是否有足够的承诺继续第三期临床试验。最近提出的随机biomarker-based二期试验设计为主要目的的生成足够的数据来通知决定随后的三期临床试验的最佳设计(90年]。

最后,相同的基本设计考虑试验将单一生物标志物应用组学测试,即使它可以更难以恰当地评估的证据组学测试来确定其准备在临床试验中使用。的困难在于一些预测的复杂性和通常不完整的报告对此类研究的方法和结果。通过考虑本文提供的标准,希望身体的证据将会更加系统和全面回顾了之前的组学在临床试验中测试应用,他们将用于指导治疗决策。

准备未来的二期或三期临床试验,将使用一个组学测试,应该进行彻底的回顾性验证的研究测试来评估其预后价值及其预测的证据能力。综述应该之前提出,进行前瞻性临床试验进行彻底评估测试的临床效益(临床实用程序)。“预测”指的是一个测试的能力来预测临床结果没有治疗(即自然历史)或在一个标准的治疗,所有病人可能会收到。“预测”(也称为治疗效果修饰符、治疗选择、或治疗指导)指的是一个测试的能力来预测效益或缺乏效益(甚至可能伤害)从一个特定的治疗相对于其他可用的治疗方法。大多数发育研究提供的证据只有一些预后预测价值但不提供令人信服的证据的预测价值,这是最好的评估的背景下,一个随机试验。甚至prospective-retrospective研究可能不是一个选项来建立预测工具如果没有标本可以从审判有关随机化和控制治疗。

在某些情况下,当一个测试的预后价值已经建立了足够健壮的回顾性研究,测试可用于限制病人的前瞻性临床试验应该是随机的。这种情况的一个例子是提供的TAILORx(试验分配个性化选项进行治疗;NCT00310180)试验中淋巴结阴性患者,激素受体阳性乳腺癌her2阴性(91年,92年]。辅助试验测试超过10000肿瘤已复发评分,分配分数低风险患者辅助内分泌治疗和那些有高风险的分数标准治疗辅助化疗或辅助化疗治疗试验中,除了辅助内分泌治疗。中间危险分数患者被随机分配接受内分泌治疗有或没有化疗的辅助治疗。它被认为是坚定患者复发的风险值已复发评分的低风险的范围太小,这些患者很少可能受益于化疗和激素治疗。这个结论是由高质量的证据支持从prospective-retrospective研究的标本它莫西芬的手臂的大型临床试验(93年),提供了额外的确认在随后的病例对照研究(94年]。化疗对患者的好处的信息风险得分在中间范围内被认为是不确定的,和那些中度风险的绝对风险的复发患者仍相当有利的;因此相信有足够的利益平衡中间危险组随机患者化疗。

另一个经常遇到的情况是,组学测试开发识别患者将受益于一个新的疗法。通常很少有信息的潜在好处的新疗法的病人测试组学的“负面”测试,因为快速的开发研究已经磨练阳性病例。提供最严格的评估能力的组学测试来预测新疗法的好处,一个应该也随机的化验结果为阴性患者接受或不接受新疗法。随机化的化验结果为阴性的患者被认为是道德,然而,必须仔细检查的证据有潜在风险,风险不仅包括由于毒性的新疗法还任何风险接受一个无效的新疗法代替一个建立有效的治疗,如果是随机被提出。如果试验将随机的化验结果为阴性的患者,应该有规定积极徒劳监测,试验可以停止早期如果大量的迹象表明,这些病人不是受益于新的疗法。

  1. 23。

    开发一个临床试验协议,包含明确的目标和方法和分析计划,包括样本量的理由;锁定和完全文档组学测试的各个方面,建立预测的分析验证。

临床试验来评估一个组学测试的临床效用一样严格的应进行临床试验来评估一个新的疗法。这包括开发一个正式协议明确详细预先确定假设,研究方法和统计分析计划。像一种新药的配方,组学测试的各个方面应明确指定,在主协议或补充协议。要记录的信息包括标本的细节要求,试验标准作业程式,数据质量评估、数据预处理、规范的数学预测模型,预测模型的解释和报告输出的临床决策。组学测试必须分析验证按照有关监管要求(见“伦理、法律和监管问题”)之前,在试验中使用会影响病人的治疗。国际会议等国际工作小组统一技术要求注册药品对人类使用(95年)发布了一些指导文件列出的原则良好的临床实践和临床试验的统计原则(指导方针E6-R1 E8、E9 E10汽油);调查人员也将遵守这些原则进行临床试验时,涉及使用的组学测试。

  1. 24。

    建立一个安全的临床数据库之间的联系临床数据,组学数据,并预测结果保持适当蒙蔽,控制研究的统计学家。

良好的临床实践要求临床数据保持在一个安全的临床数据库访问控制和质量保证过程,确保数据的完整性。同样的良好实践应遵循维护和管理组学数据和预测结果。致盲应该保持控制研究的统计学家和联系之间的临床数据和组学检测结果只有当protocol-specified临时所需的监视和最后确定的分析。调查人员将遵守FDA中概述的原则指导行业:计算机系统用于临床调查(82年]。

  1. 25。

    包括在协议的名称主要个人负责这项研究的各个方面。

成功的omics-based临床研究需要一个跨学科团队的专家,通常包括实验室科学家、临床医生、病理学家、统计学家,bioinformaticians,数据库开发人员,计算机科学家,数据管理员,管理专家。标准疗法试验的团队可能不足以涵盖所有这些领域的专业知识。是很重要的,需要对这些不同类型的专业知识完全认可和参与的基本个人命名的具体负责的个人记录的协议文档。

伦理、法律和监管问题

  1. 26岁。

    建立与个人通信,办公室和机构将监督的伦理,法律和监管问题进行相关的试验。

必须考虑法律、道德和监管问题的组学研究实验室的测试进行到诊所。特别是,开发人员需要考虑联邦、州和地方法律保护问题(关于人性的参与者96年];环境和程序执行的必要条件在体外诊断测试;测试和知识产权方面的考虑,标本组学分析平台,和计算机软件。必须小心注意对真实的或者所感知到的潜在利益冲突的调查人员,机构和赞助商。适当的保护和监管必须到位;潜在的风险和利益冲突的披露必须明确承认(见标准27)。导航的伦理、法律和监管方面的使用一种组学预测在临床试验中是最好以一个团队83年]。角色相关的个人、办公室、和机构应该一开始就明确定义。内的主要机构这可能包括主要研究者,审判赞助商,机构审查委员会和技术转让办公室(参加)。外部联系人可能包括机构在美国国立卫生研究院或其他资助机构,临床试验合作集团,商业伙伴,FDA的治疗产品和医疗设备部门(生物制品评价和研究中心,药物评价和研究中心,中心设备和放射卫生)。团队的所有成员有兴趣和责任,确保伦理、法律和监管要求的上下文中使用组学预测临床试验是全面解决。

  1. 27。

    确保签署的知情同意文件研究参与者准确地描述与使用相关的风险和潜在收益组学测试,包括银行规定标本,特别是允许& # x2018;桥接研究# x2019;来验证新的或改进的化验。

当一个测试组学是临床试验中使用,它将引导病人护理或要求病人做整形手术的人,这不是标准治疗的一部分,必须获得适当的知情同意。同意表格必须准确地描述与使用相关的风险和潜在收益的测试(和状态,测试本身是临床实验的,如果它没有得到FDA的批准或清除)。所有潜在的利益冲突的研究人员或资助机构也必须披露的知情同意文件。参与者必须告知测试结果的可能性的程度将是错误的(这将发生的频率),可能会导致不准确的治疗任务。参与者应该了解可能的后果应该分配发生一个错误的治疗。从测试过程潜在的不良事件,例如,从一个侵入性组织活检,必须清楚地解释道。知情同意也应该解决银行业标本,以便“桥接研究”,随后使用期间收集的标本试验验证新的或改进的化验。调查员负责确保使用的组学预测临床试验是由责任方在参与机构(例如,机构审查委员会协议审查委员会),试验赞助商(例如,国家癌症研究所、大学、公司),和FDA(例如,通过临床实验设备免税(IDE)和/或试验性新药应用程序;见标准30)。

  1. 28。

    地址的任何知识产权问题使用标本,生物标志物,检测和计算机软件用于计算预测。

研究者应该解决的任何知识产权问题使用标本,生物标志物,检测和计算机软件用于计算预测。知识产权索赔可以应用于一个组学测试的许多方面。例如,索赔可以附着在标本用于开发测试,被测物(s),化验本身或组件,和/或测试的计算机软件用于计算结果。在开发测试之前,它是明智的调查所有知识产权的潜在来源来确定是否存在任何权利。预计同样明智的任何知识产权在开发过程中,会生成和提前同意如何指定。所有现有的产权和协议有关未来的权利应该清楚地记录和分发给所有利害关系方最早是可行的。机构参加应该确定早期分析发展过程中是否有专利生物标志物或衡量他们的化验分析(或组件),可能会限制自由运营或开发测试。如果有这样的专利,参加和调查员应该联系专利权人早期和决定是否许可或其他住宿可以使进一步发展。例如,美国国家癌症研究所癌症治疗评估程序与制药公司(CTEP)协议有关的使用标本CTEP-sponsored试验的公司有一定的权利的任何发明来自患者的标本处理公司的代理。参加和调查员询问这些权利在考虑使用这些试验的标本。 More information is available at the CTEP website [97年]。

  1. 29。

    确保执行组学检测在临床实验室改进Amendments-certified实验室如果结果将被用来决定治疗或报告给病人或病人# x2019;医生在任何时候,即使在审判结束或不再参与研究的病人。

分析开发人员负责确保执行的测试组学是在一个适当的环境中坚持良好的实验室实践。如果测试结果将报告给病人或病人的医生在任何时候,即使在病人的研究中,分析必须至少执行一个CLIA-certified实验室98年]。CLIA国会于1988年颁布,因此这是联邦法律要求。CLIA是由医疗保险和医疗补助服务中心。也适用国家法律强加的额外要求,必须遵循的性能在体外诊断测试(99年- - - - - -103年]。

  1. 30.

    确保适当的监管机构的批准已获得临床实验利用组学测试。如果一个前瞻性的试验计划,试验将指导治疗,考虑一个pre-submission咨询与美国食品和药物管理局。

临床实验和临床使用的联邦法规在体外诊断也适用于组学测试。研究者应该联系FDA早期规划阶段的试验将使用一个组学测试,以确定是否必须提交一个IDE (104年]。IDE的规定(102年适用于任何设备,按照FDA的定义(103年),构成重大风险。IDE允许的安全性和有效性数据支持进一步发展前可能需要向营销设备和组学预测可用于临床试验。对于预测测试,IDE的预测可能要求的试验性新药应用程序(One hundred.同伴药物)。设备审查认为使用的组学分析以及其他方面的测试,包括程序要求获得标本,数学预测模型,结果报告的格式。建议获得Pre-Sub(原名pre-IDE)咨询与体外诊断设备的办公室评估和安全设备和放射健康中心的美国食品和药物管理局。Pre-Sub是免费的,不具约束力与FDA人员咨询,可以帮助确定监管机制,如果任何,最适合发展计划(103年,104年]。

监管分类取决于预期用途和潜在风险。相关的风险与使用设备可能与样本收集过程(例如,活检的风险),性能测试,或效果的治疗产生的测试结果表明,但也可能是社会或心理,取决于测试的用途。FDA使用多个分类,可以申请一个组学预测。体外诊断多元指数分析指的是使用多个变量的任何分析产生不同结果的推导不轻易可验证的最终用户(101年]。FDA最近推出了一个生物标志物资格机制(105年)简化的科学发展生物标志物及其在药物开发过程中使用。生物标志物的资格是独立于特定的试验用于测量它,但至少有一个可靠的分析必须是可用的。一旦合格,生物标志物可用于开发其他药物或化验而不需要重新使用的有效性,生物标志物在相同的上下文中使用。然而,生物标志物的资格并不消除需要满足其他监管要求使用生物标记的测试在病人护理,如IDE试验性使用或许可或批准销售。早期与FDA的磋商机制是最合适的可以帮助简化监管审批过程。

总结

评估准备的组学检测在临床护理中使用或在审判将引导病人治疗需要仔细考虑的证据支持测试的潜在临床效用和安全,以及了解伦理、法律和监管问题。考虑涉及样本,化验,恰当的统计方法用于开发和验证组学测试,临床研究设计的原则,和监管,伦理和法律问题。希望本文提供的30项清单将帮助研究人员更可靠的评估证据的质量支持组学测试,了解哪些信息是重要的文档数据出处和测试开发过程,并适当地计划使用组学预测临床试验或者临床护理,而且它将引导他们向组学测试开发的最佳实践的使用。最终目标是建立一个更有效的和可靠的过程将组学分析从承诺研究临床上有用的测试结果,改善病人护理和结果。

缩写

CLIA:

临床实验室改进修正

CTEP:

癌症治疗的评估程序

食品药品监督管理局:

食品和药物管理局

IDE:

临床实验的设备免税

国际移民组织:

医学研究所

RIN:

RNA数量完整

SOP:

标准操作程序

参加:

技术转让办公室。

引用

  1. 委员会审查Omics-Based测试预测病人在临床试验结果;董事会在医疗保健服务;健康科学政策委员会;医学研究所:平移的进化组学:经验教训和路径前进。编辑:Micheel厘米,Nass年代,Omenn GS。2012年,华盛顿特区:美国国家科学院出版社,http://www.iom.edu/Reports/2012/Evolution-of-Translational-Omics.aspx

    谷歌学术搜索

  2. 邮政G,痈DP、帕金森博士Verweij J,休伊特SM, Jessup JM:平整竞技场:将发展生物标志物和分子诊断为药物开发的标准。癌症研究杂志2012年18:1515 - 1523。10.1158 / 1078 - 0432. - ccr - 11 - 2206。

    文章PubMed公共医学中心谷歌学术搜索

  3. 麦克肖恩LM, Cavenagh MM,活泼T,埃伯哈德哒,Bigbee西城,威廉姆斯MP, Mesirov JP,波莉我,金肯塔基州,Tricoli合资,et al:标准使用omics-based预测因子的临床试验。大自然。2013年,502:317 - 320。10.1038 / nature12564。

    中科院文章PubMed公共医学中心谷歌学术搜索

  4. Apweiler R, Aslanidis C,该T,郭士纳,汉森J, Hochstrasser D, Kellner R, Kubicek M, Lottspeich F,微波激射器E,海鸥HW,迈耶,他Mullner年代,咕哝W, Neumaier M, Nollau P,一步HG, Ponten F, Radbruch,看看K, Rothe G,袜子H, Tarnok, Taussig乔丹,希尔,Thiery J, uef M,代客G, Vandekerckhove J, Verhuven W, et al:接近临床蛋白质组学:当前状态和未来在液蛋白质组学领域的应用。化学实验室医学。2009年,47:724 - 744。

    中科院文章PubMed谷歌学术搜索

  5. Espina V,穆勒C,埃德米斯顿K, Sciro M, Petricoin EF,李欧塔拉:组织是活着:新技术需要解决的问题蛋白生物标志物pre-analytical可变性。Proteom达成。2009年,3:874 - 882。10.1002 / prca.200800001。

    中科院文章谷歌学术搜索

  6. 摩尔HM,凯利AB,朱厄尔SD,麦柯肖恩LM,克拉克DP,格林斯潘R,海耶斯DF,埃诺P, P,曼斯菲尔德EA Potapova O, Riegman P Y,鲁宾斯坦Seijo E, Somiari年代,沃森P,威尔,朱C, Vaught J: Biospecimen报告提高研究质量(BRISQ)。癌症Cytopathol。2011年,119:92 - 101。10.1002 / cncy.20147。

    文章PubMed谷歌学术搜索

  7. 办公室Biorepositories和Biospecimen研究:修订NCI 2011年最佳实践。http://biospecimens.cancer.gov/practices/2011bp.asp

    谷歌学术搜索

  8. 办公室Biorepositories Biospecimen研究:Biospecimen研究数据库。https://brd.nci.nih.gov/BRN/brnHome.seam

  9. Srinivasan M, Sedmak D,朱厄尔S:各种试剂的影响和组织处理内容和核酸的完整性。中草药。2002年,161:1961 - 1971。10.1016 / s0002 - 9440 (10) 64472 - 0。

    中科院文章PubMed公共医学中心谷歌学术搜索

  10. 索普JD,段XB,福勒斯特R,劳K,布朗L,西格尔E,纳尔逊B,安德森GL,麦金托什米,城市N:血液采集条件对卵巢癌的影响血清标记。《公共科学图书馆•综合》。2007年,2:e1281 - 10.1371 / journal.pone.0001281。

    文章PubMed公共医学中心谷歌学术搜索

  11. 链C, Enell J, Hedenfalk我Ferno M: RNA质量冷冻乳腺癌样本和影响基因表达分析比较三种评价方法使用微细管电泳痕迹。BMC杂志。2007年,8:38 - 10.1186/1471 - 2199 - 8 - 38。

    文章PubMed公共医学中心谷歌学术搜索

  12. Kurban G, Gallie提单,Leveridge M,埃文斯,Rushlow D, Matevski D,古普塔R, Finelli,朱厄特马:核心活检针提供充足的材料基因组和蛋白质组学的研究肾癌:观察DNA, RNA,蛋白质提取和VHL基因突变检测。中草药Res Pract。2012年,208:22-31。10.1016 / j.prp.2011.11.001。

    中科院文章PubMed谷歌学术搜索

  13. 鲁德尼克PA,老人KR,基尔帕特里克LE Tchekhovskoi DV, Neta P,布兰德N, Billheimer DD, Blackman RK,双层DM, Cardasis霍奇金淋巴瘤,火腿AJ,贾菲JD, Kinsinger CR、Mesri M, Neubert助教,先令B, Tabb DL泰格尔TJ, Vega-Montoto L, Variyath,小王,小王P, Whiteaker JR,齐默尔曼LJ,卡尔SA,费舍尔SJ,吉布森BW, Paulovich AG)、雷尼埃菲,罗德里格斯H, et al:性能指标对液体chromatography-tandem质谱系统的蛋白质组学分析。摩尔细胞蛋白质组学。2010年,9:225 - 241。10.1074 / mcp.M900223-MCP200。

    中科院文章PubMed谷歌学术搜索

  14. Beasley-Green,双层D,鲁德尼克P,基尔帕特里克L, Phinney K:蛋白质组学性能标准支持的测量质量蛋白质组学。蛋白质组学。2012年,12:923 - 931。10.1002 / pmic.201100522。

    中科院文章PubMed谷歌学术搜索

  15. 外部RNA控制的财团:提出的方法进行测试和选择ERCC外部RNA控制。BMC基因组学。2005年,6:150。

    文章公共医学中心谷歌学术搜索

  16. 江泽民LC,施莱辛格F,戴维斯CA,张Y,李RH, Salit M, Gingeras TR,奥利弗B:合成激增RNA-seq实验标准。基因组研究》2011年,21日:1543 - 1551。10.1101 / gr.121095.111。

    中科院文章PubMed公共医学中心谷歌学术搜索

  17. Tabb DL Vega-Montoto L,鲁德尼克PA, Variyath,火腿AJL,双层DM,基尔帕特里克勒,Billheimer DD, Blackman RK, Cardasis霍奇金淋巴瘤,卡尔SA条款KR,贾菲JD, Kowalski KA, Neubert助教,雷尼埃菲,先令B,泰格尔TJ,小王,小王P, Whiteaker JR,齐默尔曼LJ,费舍尔SJ,吉布森BW, Kinsinger CR、Mesri M,罗德里格斯H,斯坦,Tempst P, Paulovich AG) Liebler, Spiegelman C, et al:重复性和再现性的蛋白质组识别液体chromatography-tandem质谱分析。J蛋白质组研究》2010年9:761 - 776。10.1021 / pr9006365。

    中科院文章PubMed公共医学中心谷歌学术搜索

  18. 茨威格MH:评估的临床实验室检测精度接受者操作特征(ROC)使用阴谋。1995年,韦恩,PA:临床和实验室标准协会

    谷歌学术搜索

  19. Dimeski G:在临床化学干扰测试。2005年,韦恩,PA:临床和实验室标准协会,2

    谷歌学术搜索

  20. 哈科特杰,阿切尔KJ, Gaigalas AK, Garrett CT,约瑟夫•LJ科赫WH, Kricka LJ, McGlennen RC, van Deerlin V, Vasquez GB:诊断核酸微阵列;批准准则。2006年,韦恩,PA:临床和实验室标准协会

    谷歌学术搜索

  21. Krouwer JS、Cembrowski GS Tholen DW:初步评估量化临床实验室测量过程。2006年,韦恩,PA:临床和实验室标准协会,3

    谷歌学术搜索

  22. 威尔逊JA Zoccoli妈,雅各布森JW,卡尔曼L, Krunic N, Matthijs G,普拉特VM, Schoonmaker MM, Tezak Z:多路核酸分析的验证和确认。2008年,韦恩,PA:临床和实验室标准协会

    谷歌学术搜索

  23. 克拉克LW:用户协议评价的定性试验性能。2008年,韦恩,PA:临床和实验室标准协会,2

    谷歌学术搜索

  24. Pierson-Perry摩根富林明,卡拉我,杜伦美联社,费舍尔C, Gutenbrunner C, Hillyard D, Kondratovich MV,也许P,以往RA:评估临床实验室检测能力的测量过程。2012年,韦恩,PA:临床和实验室标准协会,2

    谷歌学术搜索

  25. 国家癌症研究所:性能标准在临床试验中必要的化验报告要求。http://cdp.cancer.gov/scientificPrograms/pacct/assay_standards.htm

  26. 国家癌症研究所:临床试验发展的模板。http://www.cancerdiagnosis.nci.nih.gov/diagnostics/templates.htm

  27. 太阳F,并W, Uhl年代,巴拉德R,蒂普敦K, Schoelles凯西:质量、监管和Laboratory-Developed分子的临床效用测试。2010年,ECRI研究所,循证实践中心:马里兰州罗克维尔市

    谷歌学术搜索

  28. 多宾乐,啤酒DG, Meyerson M, Yeatman TJ,杰拉尔德·王,雅各布森JW,康利B, Buetow KH Heiskanen M,西蒙•RM明娜JD,吉拉德L,以免DE,泰勒JM, Hanash年代,Naoki K,海耶斯DN, Ladd-Acosta C, Enkemann SA Viale,佐丹奴TJ:多个实验室的可比性研究癌症的使用寡核苷酸微阵列基因表达分析。癌症研究杂志2005年11:565 - 572。

    中科院PubMed谷歌学术搜索

  29. Perkel JM:六件事你不会找到MAQC。科学家。2006年,20:68 - 69。

    谷歌学术搜索

  30. 施L,里德LH,琼斯WD, Shippy R,沃灵顿是的,贝克SC,科林斯PJ, de Longueville F,川崎,李肯塔基州,罗Y,太阳丫,Willey JC, Setterquist RA,费舍尔通用、通W,德拉甘YP,迪克斯DJ, Frueh弗兰克-威廉姆斯,Goodsaid调频,赫尔曼·D,詹森房车,约翰逊CD, Lobenhofer EK,宫殿RK, Schrf U, Thierry-Mieg J,王C,威尔逊M, MAQC财团等:微阵列(MAQC)项目质量控制显示国米,intraplatform再现性基因表达的测量。生物科技Nat》。2006年,24:1151 - 1161。10.1038 / nbt1239。

    中科院文章PubMed谷歌学术搜索

  31. Marioni JC,梅森CE、鬃毛SM、斯蒂芬斯M,吉拉德·Y: RNA-seq:评估技术与基因表达阵列再现性和比较。基因组研究》2008年,18:1509 - 1517。10.1101 / gr.079558.108。

    中科院文章PubMed公共医学中心谷歌学术搜索

  32. Bantscheff M, Schirle M,斯威特曼G,里克•J工业B:定量蛋白质组学质谱:一个关键的审查。肛门Bioanal化学。2007年,389:1017 - 1031。10.1007 / s00216 - 007 - 1486 - 6。

    中科院文章PubMed谷歌学术搜索

  33. Brettschneider J,科林F, Bolstad BM、速度TP:简称质量评估寡核苷酸微阵列数据反驳。技术计量学。2008年,50:279 - 283。10.1198 / 004017008000000389。

    文章谷歌学术搜索

  34. Brettschneider J,科林F, Bolstad BM、速度TP:短的寡核苷酸微阵列数据质量评估。技术计量学。2008年,50:241 - 264。10.1198 / 004017008000000334。

    文章谷歌学术搜索

  35. 贝克Kinsinger CR、Apffel J, M,扁X, Borchers CH,布拉德肖R, Brusniak我,陈DW, Deutsch电子战,多芒B,戈尔曼J,格林R,汉考克W, Hermjakob H,角D,猎人C, Kolar P,克劳斯HJ, Langen H,林德R,莫里茨RL, Omenn GS,奥兰多R, Pandey, Ping P,拉赫巴尔,河流R,西摩SL,辛普森RJ Slotta D, et al:建议开放存取数据的质谱数据质量标准(推论阿姆斯特丹原则)。188滚球软件J蛋白质组研究》2011年11:1412 - 1419。

    文章PubMed公共医学中心谷歌学术搜索

  36. 韭菜JT, Scharpf RB,布拉沃HC,西D, Langmead B,约翰逊,我们德国造D, Baggerly K,伊RA:应对广泛和高通量数据的批处理效果至关重要的影响。Nat麝猫。2010年,牧师11:733 - 739。10.1038 / nrg2825。

    中科院文章PubMed谷歌学术搜索

  37. 凯恩斯DA:统计质量控制问题的蛋白质组学分析:良好的实验设计和规划。蛋白质组学。2011年,11:1037 - 1048。10.1002 / pmic.201000579。

    中科院文章PubMed谷歌学术搜索

  38. 哈勒尔菲:回归建模策略:应用线性模型,逻辑回归,和生存分析。2001年,纽约:施普林格

    谷歌学术搜索

  39. Hastie T, Tibshirani R,弗里德曼J:统计学习的元素:数据挖掘、推理、预测。2009年,纽约:施普林格,2

    谷歌学术搜索

  40. 拉德马赫西蒙R,医学博士多宾K,麦柯肖恩LM:陷阱的使用DNA微阵列数据诊断和预后的分类。中华肿瘤杂志,2003,95:14 - 18。10.1093 / jnci / 95.1.14。

    中科院文章PubMed谷歌学术搜索

  41. Dudoit年代,Fridlyand J,速度TP:比较歧视的肿瘤基因表达数据的分类方法。J是Stat Assoc。2002年,97:77 - 87。10.1198 / 016214502753479248。

    中科院文章谷歌学术搜索

  42. L,坎贝尔G,琼斯WD,窄花边F,温家宝Z,沃克SJ,苏Z,楚TM, Goodsaid调频,Pusztai L,肖尼西JD, Oberthuer,托马斯•RS鲍里斯RS,菲尔M, Barlogie B,陈W, Du P,费舍尔M, Furlanello C,加拉BD,通用电气X, Megherbi DB, Symmans WF,王博士张J,苦H, Brors B,每蒲式耳公关,Bylesjo M, et al:微阵列共同实践的质量控制(MAQC)——研究芯片的开发和验证预测模型。生物科技Nat》。2010年,28日:827 - 838。10.1038 / nbt.1665。

    中科院文章PubMed谷歌学术搜索

  43. 风扇,风扇Y:高维分类使用特性退火独立规则。安Stat。2008年,36:2605 - 2637。10.1214 / 07-aos504。

    文章PubMed公共医学中心谷歌学术搜索

  44. Dupuy称:"现在,西蒙RM:评论发表的微阵列研究癌症的结果和统计分析和报告指南。中华肿瘤杂志,2007,99:147 - 157。10.1093 / jnci / djk018。

    文章PubMed谷歌学术搜索

  45. 萨勃拉曼尼亚J,西蒙R:基因在肺癌预后签名:准备临床使用?。中华肿瘤杂志,2010,102:464 - 474。10.1093 / jnci / djq025。

    中科院文章PubMed公共医学中心谷歌学术搜索

  46. 布臣L:错过了马克。大自然。2011年,471:428 - 432。10.1038 / 471428。

    中科院文章PubMed谷歌学术搜索

  47. 埃尼迪斯JPA,库利MJ:改善验证实践在“组学”研究。科学。2011年,334:1230 - 1232。10.1126 / science.1211811。

    中科院文章PubMed谷歌学术搜索

  48. 多宾乐,西蒙RM:最优分割情况下高维分类器训练和测试。BMC医学基因组学。2011年,4:31 - 10.1186/1755 - 8794 - 4 - 31所示。

    文章PubMed公共医学中心谷歌学术搜索

  49. 莫里纳罗,西蒙•R Pfeiffer RM:预测误差估计:重采样方法的比较。生物信息学。2005年,21日:3301 - 3307。10.1093 /生物信息学/ bti499。

    中科院文章PubMed谷歌学术搜索

  50. 麦金托什米,安德森G, Drescher C, Hanash年代,城市N, P,布朗Gambhir党卫军,Coukos G, Laird PW,纳尔逊B,帕默C:卵巢癌早期检测带有偏见。癌症研究杂志2008年14:7574 -作者回复7577 - 7579

    文章PubMed谷歌学术搜索

  51. Ambroise C,克劳克兰GJ:选择性偏差在基因提取微阵列基因表达数据的基础上。《美国国家科学院刊a . 2002, 99: 6562 - 6566。10.1073 / pnas.102102699。

    中科院文章PubMed公共医学中心谷歌学术搜索

  52. Mesirov JP:访问可再生的研究。科学。2010年,327:415 - 416。10.1126 / science.1179653。

    中科院文章PubMed谷歌学术搜索

  53. 广泛的麻省理工学院和哈佛大学:GenePattern。http://www.broadinstitute.org/cancer/software/genepattern

  54. Ludwig-Maximilians-Universitat慕尼黑:Sweave是什么?。http://www.statistik.lmu.de/ ~ leisch / Sweave

  55. 谢Y: knitr:优雅、灵活和快速动态报告生成与R。http://yihui.name/knitr

  56. 使用R与Rstudio减价。http://www.rstudio.org/docs/authoring/using_markdown

  57. GitHub: git-fast-version-control。http://git-scm.com

  58. Gelfand AE,史密斯AFM: Sampling-based边际密度计算方法。J是Stat Assoc。1990年,85:398 - 409。10.1080 / 01621459.1990.10476213。

    文章谷歌学术搜索

  59. Breiman L:随机森林。马赫学习。2001年,45:5-32。10.1023 /:1010933404324。

    文章谷歌学术搜索

  60. Ishwaran H, Kogalur乌兰巴托,百仕通(Blackstone)呃,劳尔女士:随机森林生存。安:Stat。2008年,2:841 - 860。10.1214 / 08-aoas169。

    文章谷歌学术搜索

  61. 汉斯·C多布拉,西方M:猎枪随机搜索“大p”回归。J是Stat Assoc。2007年,102:507 - 516。10.1198 / 016214507000000121。

    中科院文章谷歌学术搜索

  62. 伊RA, Bolstad BM,科林F, LM,霍布斯B,速度TP:总结Affymetrix GeneChip探测水平数据。核酸研究》2003年,31:e15 - 10.1093 / nar / gng015。

    文章PubMed公共医学中心谷歌学术搜索

  63. 伊RA,霍布斯B,科林F, Beazer-Barclay码,安东内利KJ, Scherf U,速度TP:勘探、正常化,和高密度寡核苷酸阵列探测器级数据的总结。生物统计学。2003年,4:249 - 264。10.1093 /生物统计学/ 4.2.249。

    文章PubMed谷歌学术搜索

  64. 林伊RA, Katz年代,X, Tripputi M,波特MW:总结的方法对Affymetrix GeneChip数据使用引用从一个大训练集,生物多样性数据库。BMC生物信息学。2006年,7:464 - 10.1186/1471 - 2105 - 7 - 464。

    文章PubMed公共医学中心谷歌学术搜索

  65. 考尔MN, Bolstad BM,伊RA:冷冻健壮multiarray分析(fRMA)。生物统计学。2010年,11:242 - 253。10.1093 /生物统计学/ kxp059。

    文章PubMed公共医学中心谷歌学术搜索

  66. 孙Owzar K,巴里WT、荣格SH我,乔治SL:统计在预处理微阵列实验癌症的挑战。癌症研究杂志2008年14:5959 - 5966。10.1158 / 1078 - 0432. - ccr - 07 - 4532。

    文章PubMed公共医学中心谷歌学术搜索

  67. Perou厘米,Sørlie T,艾森MB, van de Rijn M, Jeffrey党卫军Rees CA,小波拉克,罗斯DT,约翰森H, Akslen洛杉矶,Fluge O, Pergamenschikov,威廉姆斯C,朱镕基SX, Lønning PE、Børresen-Dale,棕色的阿宝,Botstein D:人类乳腺肿瘤的分子肖像。大自然。2000年,406:747 - 752。10.1038 / 35021093。

    中科院文章PubMed谷歌学术搜索

  68. Sorlie T, Sorlie T,艾森MB, van de Rijn M, Jeffrey党卫军于T,林鸽H,马泰赛JC,棕色的阿宝,Botstein D, Lønning PE、Børresen-Dale艾尔:乳房癌区分肿瘤基因表达谱的子类与临床意义。《美国国家科学院刊a . 2001, 98: 10869 - 10874。10.1073 / pnas.191367098。

    中科院文章PubMed公共医学中心谷歌学术搜索

  69. 马Alizadeh AA,艾森MB,戴维斯再保险,C, Lossos,罗森沃尔德,Boldrick JC,——H, Tran T,于X,鲍威尔,杨L,马蒂通用电气、摩尔T,哈德逊J,陆L,刘易斯DB, Tibshirani R,夏洛克G,陈WC,他一一TC, Weisenburger DD,阿米蒂奇乔Warnke R, R,征税威尔逊W, Grever先生,伯德JC, Botstein D,棕色的阿宝,et al:不同类型的弥漫型大b细胞淋巴瘤的基因表达分析。大自然。2000年,403:503 - 511。10.1038 / 35000501。

    中科院文章PubMed谷歌学术搜索

  70. 卢萨L,麦柯肖恩LM,里德摩根富林明,德Cecco L, Ambrogi F, Biganzoli E, Gariboldi M,马Pierotti:在基因表达谱数据集投影聚类结果的挑战。中华肿瘤杂志,2007,99:1715 - 1723。10.1093 / jnci / djm216。

    中科院文章PubMed谷歌学术搜索

  71. 帕克JS,马林斯M, Cheang单片机,梁年代,Voduc D,维克瑞T,戴维斯,Fauron C,他X, Z, Quackenbush摩根富林明,Stijleman IJ,宫殿J,栗色的JS,诺贝尔AB,狂欢节E,尼尔森,埃利斯•乔丹Perou厘米,伯纳德PS:监督风险预测基于内在的乳腺癌亚型。肿瘤防治杂志。2009,27日:1160 - 1167。10.1200 / JCO.2008.18.1370。

    文章PubMed公共医学中心谷歌学术搜索

  72. 卫星KGM Kengne美联社Grobbee DE,罗伊斯顿P, Vergouwe Y,奥特曼DG,伍德沃德M:风险预测模型:II。外部验证,模型更新和影响评估。心。2012年,98:691 - 698。10.1136 / heartjnl - 2011 - 301247。

    文章PubMed谷歌学术搜索

  73. 卫星KGM Kengne美联社,伍德沃德M,罗伊斯顿P, Vergouwe Y,奥特曼DG, Grobbee DE:风险预测模型:即发展,内部验证和评估一个新的(生物)的增量价值标记。心。2012年,98:683 - 690。10.1136 / heartjnl - 2011 - 301246。

    文章PubMed谷歌学术搜索

  74. 泰勒晋城无烟煤矿业集团,Ankerst DP Andridge RR:验证biomarker-based风险预测模型。癌症研究杂志2008年14:5977 - 5983。10.1158 / 1078 - 0432. - ccr - 07 - 4534。

    文章PubMed公共医学中心谷歌学术搜索

  75. 詹森AC,埃尼迪斯JP,范名女警厘米,小J,科答:加强遗传风险预测研究的报告:控制语句。科学硕士。2011年,8:e1000420 - 10.1371 / journal.pmed.1000420。

    文章PubMed公共医学中心谷歌学术搜索

  76. 奥特曼DG,麦柯肖恩LM Sauerbrei W, Taube SE:预后的肿瘤标记物的研究报告建议(备注):解释和细化。BMC医学。2012年,10:51 - 51 - 7015 - 10 - 10.1186/1741。

    文章PubMed公共医学中心谷歌学术搜索

  77. 麦柯肖恩LM、奥特曼DG Sauerbrei W, Taube SE,祗园M,克拉克通用:统计委员会NCI-EORTC工作组的癌症诊断。预后的肿瘤标记物的研究报告建议(备注)。中华肿瘤杂志,2005,97:1180 - 1184。10.1093 / jnci / dji237。

    中科院文章PubMed谷歌学术搜索

  78. Bossuyt点,Reitsma JB、布鲁斯·德·Gatsonis CA, Glasziou PP、Irwig LM, Lijmer詹,莫赫D,雷尼·D·德·兽医HC:标准报告的诊断准确性。对完整和准确诊断准确性的研究报告:热轧钢倡议。安实习生地中海。2003年,138:40-44。10.7326 / 0003-4819-138-1-200301070-00010。

    文章PubMed谷歌学术搜索

  79. Bossuyt点,Reitsma JB、布鲁斯·德·Gatsonis CA, Glasziou PP、Irwig LM,莫赫D,雷尼·D·德·兽医HC, Lijmer詹:标准报告的诊断准确性。诊断准确性的标准报告研究声明:解释和细化。2003年化学,49:7 - 18。10.1373 / 49.1.7。

    中科院文章PubMed谷歌学术搜索

  80. 格林MH、冯ZD盖尔MH:测试的重要性在卵巢癌筛查阳性预测值。癌症研究杂志2008年14:7574 - 7575。

    文章PubMed谷歌学术搜索

  81. 之一佩佩女士,琼斯H,龙腾说G, Leisenring W,纽科姆P:限制的优势比测量的性能诊断、预后、筛选标记。增加。2004年,159:882 - 890。10.1093 / aje / kwh101。

    文章PubMed谷歌学术搜索

  82. 美国食品和药物管理局:指导行业:计算机系统用于临床调查。2007年,罗克维尔市,马里兰州:美国卫生和人类服务部

    谷歌学术搜索

  83. 斯勒斯基RL,朵罗修JH,勒布朗M,康利英航:开发和在临床试验中使用积分分析。癌症研究杂志2012年18:1540 - 1546。10.1158 / 1078 - 0432. - ccr - 11 - 2202。

    文章PubMed公共医学中心谷歌学术搜索

  84. 麦柯肖恩LM,海耶斯DF:出版肿瘤标志物的研究成果:完成的必要性和透明的报告。肿瘤防治杂志。2012,30:4223 - 4232。10.1200 / JCO.2012.42.6858。

    文章PubMed公共医学中心谷歌学术搜索

  85. 西蒙RM,沉重的年代,海耶斯DF:使用存档标本的评估预后和预测生物标志物。中华肿瘤杂志,2009,101:1446 - 1452。10.1093 / jnci / djp335。

    文章PubMed公共医学中心谷歌学术搜索

  86. 萨金特D,康利英航,爱兰歌娜C,颈链L:临床试验设计的预测标记在癌症治疗试验中验证。肿瘤防治杂志。2005,23日:2020 - 2027。10.1200 / JCO.2005.01.112。

    文章PubMed谷歌学术搜索

  87. Freidlin B,麦柯肖恩LM, Korn EL:随机临床试验和生物标志物:设计问题。中华肿瘤杂志,2010,102:152 - 160。10.1093 / jnci / djp477。

    中科院文章PubMed公共医学中心谷歌学术搜索

  88. 克拉克通用,麦柯肖恩LM: Biostatistical biomarker-based发展考虑测试指导治疗决策。Stat Biopharm 2011号决议3:549 - 560。10.1198 / sbr.2011.09038。

    文章谷歌学术搜索

  89. 麦克肖恩LM Hunsberger年代,Adjei AA:有效的生物标记物进入二期试验。癌症研究杂志2009年15:1898 - 1905。10.1158 / 1078 - 0432. - ccr - 08 - 2033。

    中科院文章PubMed公共医学中心谷歌学术搜索

  90. Freidlin B,麦柯肖恩LM,波莉M-YC, Korn EL:随机二期设计与生物标志物。肿瘤防治杂志。2012,30:3304 - 3309。10.1200 / JCO.2012.43.3946。

    文章PubMed公共医学中心谷歌学术搜索

  91. Sparano JA: TAILORx:试验安排个性化的治疗选项(Rx)。中国乳腺癌。2006年,7:347 - 350。10.3816 / CBC.2006.n.051。

    文章PubMed谷歌学术搜索

  92. Zujewski JA·L:试用评估个性化治疗乳腺癌的选项:TAILORx试验。未来的肿瘤防治杂志。2008年,4:603 - 610。10.2217 / 14796694.4.5.603。

    中科院文章PubMed谷歌学术搜索

  93. 沉重的年代,Shak年代,唐G,金正日C,贝克J,克罗宁M, Baehner FL,沃克MG,沃森D,公园T,希勒W,费舍尔,Wickerham DL,科比J, Wolmark N:服用它莫西芬基因分析预测复发的,淋巴结阴性乳腺癌。郑传经地中海J。2004年,351:2817 - 2826。10.1056 / NEJMoa041588。

    中科院文章PubMed谷歌学术搜索

  94. Habel洛杉矶,Shak年代,雅各布斯可·卡普拉,亚历山大·C,越南河粉,贝克J,沃克M,沃森D,哈科特J,耀光NT,格林伯格D,一定要L, Langholz B, Quesenberry CP:一项以人群为基础的研究肿瘤基因表达与乳腺癌淋巴淋巴结阴性患者死亡的风险。乳腺癌研究》2006年8:r25 - 10.1186 / bcr1412。

    文章PubMed公共医学中心谷歌学术搜索

  95. 国际会议上统一技术要求注册药品对人类使用:我的主页。http://www.ich.org

  96. 美国卫生和人类服务部:SACHRP给秘书:常见问题,对知情同意条款和建议和研究biospecimens的使用。http://www.hhs.gov/ohrp/sachrp/20110124attachmentatosecletter.html

  97. 癌症治疗评估程序:调查员资源。http://ctep.cancer.gov/investigatorResources/biomarker_resources.htm

  98. 医疗保险和医疗补助服务中心:临床实验室改进修正案(CLIA)。http://www.cms.gov/Regulations-and-Guidance/Legislation/CLIA/index.html?redirect=/CLIA

  99. 美国食品和药物管理局:设备建议:全面监管援助。http://www.fda.gov/MedicalDevices/DeviceRegulationandGuidance/default.htm

  100. 美国食品和药物管理局:试验性新药(印第安纳州)应用程序。http://www.fda.gov/Drugs/DevelopmentApprovalProcess/HowDrugsareDevelopedandApproved/ApprovalApplications/InvestigationalNewDrugINDApplication/default.htm

  101. 体外诊断设备和放射卫生中心:多元指数分析。2007年,罗克维尔市,马里兰州:美国食品和药物管理局

    谷歌学术搜索

  102. 美国食品和药物管理局:21 CFR。我章,分章H, 812年部分:临床实验设备免税。2012年,罗克维尔市,MD:美国卫生和人类服务部

    谷歌学术搜索

  103. 美国食品和药物管理局:该产品是医疗器械吗?。http://www.fda.gov/medicaldevices/deviceregulationandguidance/overview/classifyyourdevice/ucm051512.htm

  104. 美国食品和药物管理局:起草指导工业和食品及药物管理局工作人员:医疗设备:Pre-Submission项目和会议与FDA工作人员。马里兰州罗克维尔市2012年:美国卫生和人类服务部,http://www.fda.gov/MedicalDevices/DeviceRegulationandGuidance/GuidanceDocuments/ucm310375.htm

    谷歌学术搜索

  105. 美国食品和药物管理局:生物标志物资格程序。http://www.fda.gov/Drugs/DevelopmentApprovalProcess/DrugDevelopmentToolsQualificationProgram/ucm284076.htm

出版前的历史

下载参考

作者信息

从属关系

作者

相应的作者

对应到丽莎M麦柯肖恩

额外的信息

相互竞争的利益

作者宣称没有利益冲突。

作者的贡献

BAC LMM构思这篇论文的想法和清单。初稿的手稿是一个共同努力在几个作者贡献根据他们特定的专业领域(WLB MMC, BAC, DAE, TGL和LMM)。所有作者提供的评论,建议编辑,并造成额外的专业知识提高初稿和生成最终的版本的手稿。所有作者阅读和批准最终的手稿。

权利和权限

这篇文章发表在生物医学中心有限公司的许可证。这是一个开放获取知识共享归属条款条许可证(188滚球软件http://creativecommons.org/licenses/by/2.0),允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。

再版和权限

关于这篇文章

引用这篇文章

麦克肖恩,L.M.,Cavenagh, M.M., Lively, T.G.et al。标准在临床试验中使用omics-based预测:解释和细化。BMC医学11日,220 (2013)。https://doi.org/10.1186/1741 - 7015 - 11 - 220

下载引用

  • 收到了:

  • 接受:

  • 发表:

  • DOI:https://doi.org/10.1186/1741 - 7015 - 11 - 220

关键字

  • 分析验证
  • 生物标志物
  • 诊断测试
  • 基因分类器
  • 模型验证
  • 分子概要
  • 组学
  • 个性化医疗
  • 精密医学
  • 治疗的选择