观察性流行病学研究容易混淆,反向因果关系和各种偏见和生成的结果,已被证明是不可靠的指标修改暴露在疾病的因果影响的结果。孟德尔随机化(先生)是一种方法,利用强劲的遗传变异与这些修改的风险敞口产生更可靠的证据有关干预措施应该生产健康的好处。被广泛应用的方法,各种方法加强推理给出已知的潜在先生现在可用的局限性。先生先生的发展,包括两个示例,双向先生,网络先生、两步,先生!先生和multiphenotype先生,是本文中概述。遗传信息的集成以人群为基础的流行病学研究提供了转化的机会,利用基因组研发投资。
介绍
许多例子的存在显然健壮的观察行为之间的关联,药理或生理指标和疾病风险,当受到随机对照试验(相关的),不提供预期的健康益处(1)。其中包括许多营养因素(例如一些维生素)、药物(如激素替代疗法)和循环生物标记物(如高密度脂蛋白胆固醇)(1- - - - - -4)。混杂,反向因果关系和各种偏见可以产生关联,甚至仔细研究设计和统计调整,不正确的因果推论是可能的(1,5)。这些问题的识别方面的流行病学调查导致了一系列的应用方法旨在提高因果推论(6,7)。一个成功的方法是使用遗传变异暴露指标,不受污染的影响传统的研究设计,这种方法被称为孟德尔随机化(先生)(8,9)。我们不会重复先生的许多详细的评论,现在存在(8,10- - - - - -15),也总结了数以百计的实证研究将这项技术应用于广泛的暴露与疾病的结果,相反,简要概述了基本原则后,我们将概述该领域的最新发展和潜在的未来的发展方向。
孟德尔随机化的基本原则
假设特征和特征B是相关的,因此,如果这种相关性是因为A导致B,那么任何变量影响特征也会影响特征B的关键推断A和B之间的因果关系是确定的“乐器”可靠与一分之一的已知的方向有关。生物学家在这方面处于优势地位,因为几乎所有感兴趣的特征至少部分受到基因的影响,和基因的影响可以作为优秀的工具的原因。首先,在遗传协会,遗传多态性的因果关系的方向是感兴趣的特征,而不是反之亦然。第二,传统测量环境因素往往与广泛的相关行为,社会和生理因素,使人联想到结果(16)。基因变异,另一方面,可以作为unconfounded特定指标特征值(16)。第三,遗传变异及其受到的影响相对较小的测量误差或偏差。第四,实际的因果变异的特征不是必需的,一个标记在连锁不平衡(LD)因果变异将满足条件的最后,先生时代的全基因组关联研究(GWAS)和高通量基因组技术在大型well-phenotyped研究基因数据通常可用。
类比孟德尔随机化和随机对照试验
一个直观的方式了解先生可以用来推断因果关系是通过与相关的类比。在相关的研究对象是随机分配给一个或另一个治疗,避免潜在的治疗和结果之间的混淆,并明确的因果推论。先生为我们创建了一个类似的场景。假设一个特定的等位基因强劲相关特征,和特征成因特征b等位基因在很大程度上是由父母传给子女的独立环境,继承了等位基因的人,实际上,被分配一个更高的平均剂量的特质,而那些不承受等位基因被分配一个较低的平均剂量。在相关,组织定义为基因型将经历一个平均接触特征的差异,而不是不同的混杂因素。因此,基因型分析相当于意向性治疗分析个随机对照试验,在分析个人根据他们被随机分配到组,独立于他们是否遵守治疗方案。这种形式的分析确保混淆不是重新允许重新分类随机化后的接触状态。
经验证据表明,有一个普遍缺乏混杂的遗传变异因素混淆暴露在传统广泛观察性流行病学研究(16,17),但重要的是要采取适当的措施来避免引入混淆通过人口分层。
先生到目前为止,已成功应用于广泛的观测协会、覆盖应用程序的因果效应生物标志物在疾病、生理指标之间的相关性,了解评估各种行为和指定的因果影响母体子宫内的影响(表1)。在某些情况下,它可以执行一个工具变量分析来获得估计因果效应的大小的暴露感兴趣的结果在调查中,我们概述箱1。先生有很多局限性,应考虑在使用这种方法(表2),已在别处讨论(8,10- - - - - -15)。基因多效性(框2)在这方面的问题尤其严重。本文的其余部分将概述先生的最新进展,其中一些显式地寻求解决这些局限性。
类型。 | 接触/特征。 | 疾病/结果。 | 结论。 |
---|---|---|---|
生物标记物 | c反应蛋白 | 冠心病 | 观察c反应蛋白与冠心病之间的关系是混杂的结果和/或反向因果关系(18) |
血清铁 | 帕金森病 | 高血清铁水平降低帕金森病的风险(19) | |
尿酸 | 冠心病 | 观察尿酸与冠心病之间的关系,在某种程度上,由于BMI(混杂20.) | |
巨噬细胞移动抑制因子(MIF) | 2型糖尿病 | MIF升高,在其他因素,会增加2型糖尿病的风险(21) | |
白介素6(白细胞介素6) | 冠心病 | 白细胞介素6会增加冠心病的风险(22,23) | |
行为 | 吸烟 | 焦虑/抑郁 | 焦虑和抑郁在吸烟者似乎没有吸烟的结果(24,25) |
酒精消费 | 血压 | 饮酒增加血压(26) | |
生理指标 | 身体质量指数 | 胆石病症状 | 高BMI增加胆石病症状的风险(27)。 |
母亲的影响(母亲和孩子之间的遗传相关纠正) | 酒精消费 | 儿童在学校的表现 | 观测发现,温和的母亲饮酒与更有利的学校表现是由于混淆,和休闲协会是在相反的方向(28) |
母亲的体重指数 | 脂肪量的后代 | 脂肪量在9 - 11岁的儿童是不强烈影响体重指数的母亲在怀孕期间(29日) |
类型。 | 接触/特征。 | 疾病/结果。 | 结论。 |
---|---|---|---|
生物标记物 | c反应蛋白 | 冠心病 | 观察c反应蛋白与冠心病之间的关系是混杂的结果和/或反向因果关系(18) |
血清铁 | 帕金森病 | 高血清铁水平降低帕金森病的风险(19) | |
尿酸 | 冠心病 | 观察尿酸与冠心病之间的关系,在某种程度上,由于BMI(混杂20.) | |
巨噬细胞移动抑制因子(MIF) | 2型糖尿病 | MIF升高,在其他因素,会增加2型糖尿病的风险(21) | |
白介素6(白细胞介素6) | 冠心病 | 白细胞介素6会增加冠心病的风险(22,23) | |
行为 | 吸烟 | 焦虑/抑郁 | 焦虑和抑郁在吸烟者似乎没有吸烟的结果(24,25) |
酒精消费 | 血压 | 饮酒增加血压(26) | |
生理指标 | 身体质量指数 | 胆石病症状 | 高BMI增加胆石病症状的风险(27)。 |
母亲的影响(母亲和孩子之间的遗传相关纠正) | 酒精消费 | 儿童在学校的表现 | 观测发现,温和的母亲饮酒与更有利的学校表现是由于混淆,和休闲协会是在相反的方向(28) |
母亲的体重指数 | 脂肪量的后代 | 脂肪量在9 - 11岁的儿童是不强烈影响体重指数的母亲在怀孕期间(29日) |
类型。 | 接触/特征。 | 疾病/结果。 | 结论。 |
---|---|---|---|
生物标记物 | c反应蛋白 | 冠心病 | 观察c反应蛋白与冠心病之间的关系是混杂的结果和/或反向因果关系(18) |
血清铁 | 帕金森病 | 高血清铁水平降低帕金森病的风险(19) | |
尿酸 | 冠心病 | 观察尿酸与冠心病之间的关系,在某种程度上,由于BMI(混杂20.) | |
巨噬细胞移动抑制因子(MIF) | 2型糖尿病 | MIF升高,在其他因素,会增加2型糖尿病的风险(21) | |
白介素6(白细胞介素6) | 冠心病 | 白细胞介素6会增加冠心病的风险(22,23) | |
行为 | 吸烟 | 焦虑/抑郁 | 焦虑和抑郁在吸烟者似乎没有吸烟的结果(24,25) |
酒精消费 | 血压 | 饮酒增加血压(26) | |
生理指标 | 身体质量指数 | 胆石病症状 | 高BMI增加胆石病症状的风险(27)。 |
母亲的影响(母亲和孩子之间的遗传相关纠正) | 酒精消费 | 儿童在学校的表现 | 观测发现,温和的母亲饮酒与更有利的学校表现是由于混淆,和休闲协会是在相反的方向(28) |
母亲的体重指数 | 脂肪量的后代 | 脂肪量在9 - 11岁的儿童是不强烈影响体重指数的母亲在怀孕期间(29日) |
类型。 | 接触/特征。 | 疾病/结果。 | 结论。 |
---|---|---|---|
生物标记物 | c反应蛋白 | 冠心病 | 观察c反应蛋白与冠心病之间的关系是混杂的结果和/或反向因果关系(18) |
血清铁 | 帕金森病 | 高血清铁水平降低帕金森病的风险(19) | |
尿酸 | 冠心病 | 观察尿酸与冠心病之间的关系,在某种程度上,由于BMI(混杂20.) | |
巨噬细胞移动抑制因子(MIF) | 2型糖尿病 | MIF升高,在其他因素,会增加2型糖尿病的风险(21) | |
白介素6(白细胞介素6) | 冠心病 | 白细胞介素6会增加冠心病的风险(22,23) | |
行为 | 吸烟 | 焦虑/抑郁 | 焦虑和抑郁在吸烟者似乎没有吸烟的结果(24,25) |
酒精消费 | 血压 | 饮酒增加血压(26) | |
生理指标 | 身体质量指数 | 胆石病症状 | 高BMI增加胆石病症状的风险(27)。 |
母亲的影响(母亲和孩子之间的遗传相关纠正) | 酒精消费 | 儿童在学校的表现 | 观测发现,温和的母亲饮酒与更有利的学校表现是由于混淆,和休闲协会是在相反的方向(28) |
母亲的体重指数 | 脂肪量的后代 | 脂肪量在9 - 11岁的儿童是不强烈影响体重指数的母亲在怀孕期间(29日) |
限制。 | 先生的作用研究。 | 评估方法或避免限制。 |
---|---|---|
低的统计能力 | 低功率和效果的研究往往先生估计不精确的,因为这个 | 增加样本容量,或结合的遗传变异,所以他们解释更多的中间表型的方差 |
反向因果关系 | 基因变异可能导致疾病的结果反过来导致生物标记,或因果方向相反的方向。2 sls不会区分这些情况 | 双向先生可以用来区分两个因果模型 |
人口分层 | 假协会作为工具可能导致错误的因果推论 | 限制分析种族同质组和应用校正方法使用祖先地从全基因组数据的标记或主成分。在一个家庭中执行分析研究背景下,如兄弟姐妹之间。 |
重新混杂虽然基因多效性 | 基因变异可能直接影响多个转录后的过程。已知的一些基因变异 | 在可能的情况下使用独联体变异对中间表型研究下,因为这些可能会不太可能有多效性的影响。应用多个仪器方法与多个独立的基因变异基因多效性将不太可能产生相同的联想不同的乐器 |
LD引起混淆 | LD基因关联研究是至关重要的,因为它允许标记snp代理un-genotyped因果snp。然而,这可以引入混淆如果LD导致协会的单核苷酸多态性与多个转录后的过程。这种情况下将类似基因多效性的情况 | 研究人群中可进行不同的LD结构。方法避免失真的基因多效性也将反问题由于LD |
开运河/发展补偿 | 在开发期间,补偿过程可能产生反基因变异的表型微扰的使用作为一个乐器 | 没有开发的一般方法,虽然可以应用上下文特定的生物知识。生命历程的时期当遗传变异对中间表型的影响出现可以表明是否开运河,原则上,是个问题 |
缺乏遗传变异为修改的暴露感兴趣的代理 | 没有可靠的基因变异协会对许多感兴趣的中间表型,虽然现在越来越多的这些标识 | 持续的全基因组和sequencing-based研究 |
关联的复杂性 | 没有足够的生物知识,误导推论关于中间表型和疾病的可能 | 增加生物的理解genotype-phenotype链接 |
限制。 | 先生的作用研究。 | 评估方法或避免限制。 |
---|---|---|
低的统计能力 | 低功率和效果的研究往往先生估计不精确的,因为这个 | 增加样本容量,或结合的遗传变异,所以他们解释更多的中间表型的方差 |
反向因果关系 | 基因变异可能导致疾病的结果反过来导致生物标记,或因果方向相反的方向。2 sls不会区分这些情况 | 双向先生可以用来区分两个因果模型 |
人口分层 | 假协会作为工具可能导致错误的因果推论 | 限制分析种族同质组和应用校正方法使用祖先地从全基因组数据的标记或主成分。在一个家庭中执行分析研究背景下,如兄弟姐妹之间。 |
重新混杂虽然基因多效性 | 基因变异可能直接影响多个转录后的过程。已知的一些基因变异 | 在可能的情况下使用独联体变异对中间表型研究下,因为这些可能会不太可能有多效性的影响。应用多个仪器方法与多个独立的基因变异基因多效性将不太可能产生相同的联想不同的乐器 |
LD引起混淆 | LD基因关联研究是至关重要的,因为它允许标记snp代理un-genotyped因果snp。然而,这可以引入混淆如果LD导致协会的单核苷酸多态性与多个转录后的过程。这种情况下将类似基因多效性的情况 | 研究人群中可进行不同的LD结构。方法避免失真的基因多效性也将反问题由于LD |
开运河/发展补偿 | 在开发期间,补偿过程可能产生反基因变异的表型微扰的使用作为一个乐器 | 没有开发的一般方法,虽然可以应用上下文特定的生物知识。生命历程的时期当遗传变异对中间表型的影响出现可以表明是否开运河,原则上,是个问题 |
缺乏遗传变异为修改的暴露感兴趣的代理 | 没有可靠的基因变异协会对许多感兴趣的中间表型,虽然现在越来越多的这些标识 | 持续的全基因组和sequencing-based研究 |
关联的复杂性 | 没有足够的生物知识,误导推论关于中间表型和疾病的可能 | 增加生物的理解genotype-phenotype链接 |
限制。 | 先生的作用研究。 | 评估方法或避免限制。 |
---|---|---|
低的统计能力 | 低功率和效果的研究往往先生估计不精确的,因为这个 | 增加样本容量,或结合的遗传变异,所以他们解释更多的中间表型的方差 |
反向因果关系 | 基因变异可能导致疾病的结果反过来导致生物标记,或因果方向相反的方向。2 sls不会区分这些情况 | 双向先生可以用来区分两个因果模型 |
人口分层 | 假协会作为工具可能导致错误的因果推论 | 限制分析种族同质组和应用校正方法使用祖先地从全基因组数据的标记或主成分。在一个家庭中执行分析研究背景下,如兄弟姐妹之间。 |
重新混杂虽然基因多效性 | 基因变异可能直接影响多个转录后的过程。已知的一些基因变异 | 在可能的情况下使用独联体变异对中间表型研究下,因为这些可能会不太可能有多效性的影响。应用多个仪器方法与多个独立的基因变异基因多效性将不太可能产生相同的联想不同的乐器 |
LD引起混淆 | LD基因关联研究是至关重要的,因为它允许标记snp代理un-genotyped因果snp。然而,这可以引入混淆如果LD导致协会的单核苷酸多态性与多个转录后的过程。这种情况下将类似基因多效性的情况 | 研究人群中可进行不同的LD结构。方法避免失真的基因多效性也将反问题由于LD |
开运河/发展补偿 | 在开发期间,补偿过程可能产生反基因变异的表型微扰的使用作为一个乐器 | 没有开发的一般方法,虽然可以应用上下文特定的生物知识。生命历程的时期当遗传变异对中间表型的影响出现可以表明是否开运河,原则上,是个问题 |
缺乏遗传变异为修改的暴露感兴趣的代理 | 没有可靠的基因变异协会对许多感兴趣的中间表型,虽然现在越来越多的这些标识 | 持续的全基因组和sequencing-based研究 |
关联的复杂性 | 没有足够的生物知识,误导推论关于中间表型和疾病的可能 | 增加生物的理解genotype-phenotype链接 |
限制。 | 先生的作用研究。 | 评估方法或避免限制。 |
---|---|---|
低的统计能力 | 低功率和效果的研究往往先生估计不精确的,因为这个 | 增加样本容量,或结合的遗传变异,所以他们解释更多的中间表型的方差 |
反向因果关系 | 基因变异可能导致疾病的结果反过来导致生物标记,或因果方向相反的方向。2 sls不会区分这些情况 | 双向先生可以用来区分两个因果模型 |
人口分层 | 假协会作为工具可能导致错误的因果推论 | 限制分析种族同质组和应用校正方法使用祖先地从全基因组数据的标记或主成分。在一个家庭中执行分析研究背景下,如兄弟姐妹之间。 |
重新混杂虽然基因多效性 | 基因变异可能直接影响多个转录后的过程。已知的一些基因变异 | 在可能的情况下使用独联体变异对中间表型研究下,因为这些可能会不太可能有多效性的影响。应用多个仪器方法与多个独立的基因变异基因多效性将不太可能产生相同的联想不同的乐器 |
LD引起混淆 | LD基因关联研究是至关重要的,因为它允许标记snp代理un-genotyped因果snp。然而,这可以引入混淆如果LD导致协会的单核苷酸多态性与多个转录后的过程。这种情况下将类似基因多效性的情况 | 研究人群中可进行不同的LD结构。方法避免失真的基因多效性也将反问题由于LD |
开运河/发展补偿 | 在开发期间,补偿过程可能产生反基因变异的表型微扰的使用作为一个乐器 | 没有开发的一般方法,虽然可以应用上下文特定的生物知识。生命历程的时期当遗传变异对中间表型的影响出现可以表明是否开运河,原则上,是个问题 |
缺乏遗传变异为修改的暴露感兴趣的代理 | 没有可靠的基因变异协会对许多感兴趣的中间表型,虽然现在越来越多的这些标识 | 持续的全基因组和sequencing-based研究 |
关联的复杂性 | 没有足够的生物知识,误导推论关于中间表型和疾病的可能 | 增加生物的理解genotype-phenotype链接 |
最近扩展基本的孟德尔随机化
使用多个变体增加力量和测试假设
先生在理想的情况下,使用单一执行变异的生物效应是乐器的特点理解。然而,即使这种情况下受到几个潜在的局限性,通过增加数量可以部分减轻变体作为工具。
首先,遗传效应可能不是特别大,导致疲软的仪器和要求非常大的样本量。通过增加变异的数量,方差解释为仪器的比例增加,从而提高精度在两阶段最小二乘回归(箱1)(50)。结合这些成一个加权等位基因分数通常是最佳的方法在这种情况下(51)。
第三,多个变体也可以提供一些证据关于问题关联的复杂性的问题研究(见先生盒3)。如果多个变种,通过不同的机制都与一个特定的中间表型与疾病的方式预测的结果与中间phenotype-as在多个变体相关的低密度和冠心病,讨论前通过特定的方式哪一种变体与中间表型不太可能影响累积证据。
通常,只是作为工具,如果他们的遗传变异在GWAS可靠地检测和复制。然而,预测能力可能提高当snp不达到阈值意义也包括在内,这些将包括误报警的基本原理是由于小尺寸效应(56)。这种方法可以改善先生的力量,但相当大的应该谨慎,由于增加的机会引入多效性的影响(框2)(57)。
两个示例孟德尔随机化
通常情况下,一种观察两个变量之间的关系存在,但测量成本高或缺乏适当的biospecimens导致相对较小的数据集和中间表型和遗传工具。方法已经开发执行第四分析中间表型和结果变量时以两个独立的数据集(58),这些可以应用上下文(先生31日)。这种方法可以特别有价值的应用存在非常大的数据集有关GWAS数据对疾病的结果,但缺乏中间表型数据。
另一个场景,在该场景中,可以使用两个示例,如果数据集执行先生一样被用来识别工具。GWAS是已知的导致过高的遗传效应大小的由于赢家的诅咒”的现象,这可能导致偏见先生将数据集划分为两个(或更多)样品进行评估和测试可以缓解这个问题。该方法已应用于体育活动和儿童肥胖症的研究(59)。
双向和网络孟德尔随机化
先生的主要限制是它很难区分一个暴露导致一个结果,结果导致特征,因为基因变异可以有他们的主要影响变量。例如,动脉粥样化和身体质量指数(BMI)影响c反应蛋白(CRP)水平,明显误导性的因果效应可以生成一种基因变异,主要影响动脉粥样化或BMI是错误的是一个变种主要对CRP的影响(60)。
关注仪器存在某种程度的生物学理解,双向先生可以应用在这种情况下。在这里,这两个变量所需仪器,和先生在两个方向上执行(无花果。1)。如果B特征成因特征,乐器,Z一个,将A和B .然而,第二个仪器具体特征B,ZB,将相关的特质,而不是特征答:这种方法只适用条件是相互关联的两个仪器不是略微(如为A和B之间没有LD仪器)。这种方法已被用于证明BMI的影响c反应蛋白水平(61年,62年),维生素D (63年)、尿酸(20.,64年)和fetuin-A (65年),而不是反之亦然。从不同的研究提取数据也可以利用在这个上下文;先生为例,研究表明,il - 6的影响c反应蛋白水平,但不是反之亦然(18,22,23)。
利用变异时认识的生物效应,双向先生可能具有误导性,因为很明显,如果特征影响特征B GWAS研究足够的统计能力就会确定一个变种与主要影响特征与特征。这反映了“伪”或“II型”基因多效性(框2),存在很多这样的例子。例如,FTO最初确定的变化与2型糖尿病,与后续的识别,这是由于基因变异与体重指数相关,进而增加2型糖尿病的风险(38)。同样,遗传变异与主要影响体重指数出现在顶部点击GWAS c反应蛋白(66年),但显然不能被利用作为c反应蛋白水平的工具。使用等位基因的分数在双向先生的研究将会增加错误的可能性包括一个变种主要影响特征,主要影响特征B,顺向误解,发现这些研究需要谨慎对待(59)。利用多个单一和复合工具可以帮助询问这种情况下,因为如果特征影响特征B,而不是反之亦然相关,那么所有变异特征与特征B,但情况不会恰恰相反。
应用双向先生在两变量设置,但显然这可以扩大探索因果网络内的方向更多的相关变量(67年)。这样的网络,是当前活动的区域发展,与并行逻辑因果的基因定位的应用解剖基因相互作用网络(68年,69年)。
中介和两步孟德尔随机化
网络将通常包含中介的情况下,曝光之间的关系和一个结果可能通过一个中介因素。例如,高体重指数可能增加冠心病的风险通过它对血压的影响。传统中介分析在流行病学领域,仅仅利用表型的测量,是有问题的,因为它是高度依赖的测量特征变量和可靠识别因果效应(70年- - - - - -72年)。在这种情况下,它可能会获得因果估计先生研究链中的所有步骤。在上述例子中,先生的研究表明,肥胖会导致高血压(41),反过来高血压会增加冠心病的风险(73年)。更可靠的规范的量化贡献中介(血压)随意曝光(BMI)和结果之间的联系(冠心病)可以用这些数据。
先生的方法可以应用到中介在高维情况下潜在的中介数据,,例如,在中介的描述特定的表观遗传过程环境因素与疾病之间。这被称为两步先生(74年)。中间表型,如DNA甲基化,可以显示组织特异性,在遗传和表型之间的关联可以不同组织,和方便的化验样本(如从血液中提取DNA的甲基化)的DNA甲基化可能并不代表组织负责疾病发展75年,76年)。获得组织大量的个人数据是具有挑战性的,但使用两个示例和两步,方法可以应用。首先,两者的因果关联的甲基化和接触独联体SNP在甲基化感兴趣的组织可以建立,然后在一个更大的人群为基础的样本,苏格兰民族党对暴露与疾病的结果描述。4盒说明了这些更复杂的逻辑方法。
的阶乘孟德尔随机化
导致疾病的共同行动的方式增加疾病风险可以公众健康有重要影响,随着above-additive效应导致的集群风险因素,产生更大的人口的疾病负担。例如,证据的组合影响肥胖和重型饮酒对肝脏疾病的风险大于乘法(77年)。这是很难估计的效果,然而,随着混杂时可以放大检查两个已经惊慌失措的风险因素。阶乘相关的独立随机化每个治疗来解决此问题,允许描述它们之间的交互(78年)。同样,遗传变异的组合可以用来执行!研究获得unconfounded先生估计的影响同现的两个疾病的危险因素。
Multiphenotype孟德尔随机化
在某些情况下,往往是与多个中间表型的遗传变异,和评估一个特定的因果效应中间表型是有问题的。例如,高密度脂蛋白胆固醇和甘油三酯是根据观察与冠心病有关,但他们也是高度负相关,和观察性研究不能可靠地分离的影响(79年)。许多遗传变异与高密度脂蛋白胆固醇和甘油三酯,其中有大量与措施(80年),这似乎是I型基因多效性的例子(框2)。而阶乘先生可以应用于multiphenotype当不同的单核苷酸多态性的关系可以看作是辅助变量对于每个表型,在这种情况下,这是不可能的因为构造一个乐器,纯粹与表型目前是不可能的。初步询问这个问题的方法是使用回归方法来试图独立的影响,和两个独立的研究利用这种方法最近暗示的因果影响甘油三酯强劲,而高密度脂蛋白胆固醇并不明显保护作用(81年,82年)。不同的统计方法的恰当性和可靠的答案是否可以获得活跃multiphenotype上下文保持地区的调查。
Hypothesis-free孟德尔随机化
先生的多数研究集中在测试假设源自之间的关联特征的观察性研究。但这只是冰山一角?一个说明性的例子有更潜在的关联比已知被布莱尔提出et al。煤层开采后,1.1亿名患者的医疗记录,发现2909年孟德尔疾病之间的关联和复杂的特征,其中大部分以前未报告的(83年)。作为高通量组学技术继续在时间和财务成本,减少数据集与基因型和表现型注定要成长,全面和原则上,应该有可能构造工具对许多风险,通过数据挖掘获取有关证据的结果造成这些风险敞口(57)。更大胆,从数据中生成工具和执行split-sample或重叠IV分析,包括双向分析,可以解决因果方向的网络内表型,没有提前规范的接触或正在检查结果(67年)。
结论
解决观察相关性成因果关系的核心是一个难以捉摸的问题理解生物,医药开发、预防疾病和医疗实践。先生可能是一个健壮的方法,可以支持这一努力,和它的应用范围将扩大的成本数据生成继续减少。发现先生的上下文中研究需要解释相关证据下的特定问题调查,同时,它的应用将有助于“最佳解释推理”(84年)加强因果推论的方法。识别最有前途的干预目标的例子中,通过加强pharmacotherapy-can先生的应用,从而带来一个更加合理的方法优先治疗相关的评估。
资金
这项工作是由英国医学研究理事会MC_UU_12013/1-9。资金支付开放获取出版费用MRC综合流行188滚球软件病学单位提供的这篇文章是布里斯托尔大学(MC_UU_12013/5)。
确认
由于希拉鸟人(2002年)建议“阶乘孟德尔随机化”一词,汤姆·帕默建议术语“multiphenotype孟德尔随机化”和马提亚Egger,凡妮莎Didelez和卡罗琳Relton评论较早的一份草案。布莱恩过请提供图2的副本。
利益冲突声明。没有宣布。