。 2015年10月1日,97 (4):576 - 92。

doi: 10.1016 / j.ajhg.2015.09.001。

建模连锁不平衡增加多基因风险评分的准确性

Bjarni J Vilhjalmsson¹, 剑杨², 希拉里K芬努凯恩³, 亚历山大·卡西⁴, 萨拉·林德斯特伦⁵, Stephan Ripke⁶, 朱里奥热那亚⁷, Po-Ru Loh⁴, Gaurav Bhatia⁴, 罗恩做⁸, 特里斯坦Hayeck⁴, Hong-Hee赢得⁹; 精神分裂症精神病基因研究团的工作小组,发现,遗传变异在乳腺癌的生物学和风险(驱动)的研究; Sekar Kathiresan⁹, 米歇尔·帕托¹⁰, 卡洛斯·帕托¹⁰, Rulla Tamimi¹¹, 艾利斯特尔¹², 诺亚Zaitlen¹³, Bogdan Pasaniuc¹⁴, 吉莉安Belbin⁸, Eimear E肯尼¹⁵, 麦克尔- H Schierup¹⁶, 菲利普De Jager¹⁷, 思一个Patsopoulos¹⁷, 史蒂夫McCarroll⁷, 马克•戴利¹⁸, 肖恩·珀塞尔¹², 丹尼尔这样¹⁹, 本杰明。尼尔。¹⁸, 迈克尔·戈达德^20., 彼得·米维斯², 彼得·卡夫²¹, 尼克•帕特森²², 碱性L价格²³

合作者,从属关系

PMID:26430803
PMCID:PMC4596916
DOI:10.1016 / j.ajhg.2015.09.001

免费的PMC的文章

建模连锁不平衡增加多基因风险评分的准确性

Bjarni J Vilhjalmssonet al。是J哼麝猫。 2015年。

免费的PMC的文章

。 2015年10月1日,97 (4):576 - 92。

doi: 10.1016 / j.ajhg.2015.09.001。

PMID:26430803
PMCID:PMC4596916
DOI:10.1016 / j.ajhg.2015.09.001

文摘

多基因风险评分显示巨大的希望在预测复杂的疾病风险,随着训练样本大小的增加将变得更加准确。标准方法计算风险评分包括连锁不平衡(LD)的标记修剪和p值阈值应用到协会统计数据,但这丢弃信息和可以减少预测的准确性。我们介绍中将,方法推断后意味着每一个标记的效果使用之前的影响大小和LD信息从外部参考面板。理论和模拟显示,中将优于修剪其次是阈值的方法,特别是在大样本大小。因此,预测R(2)从20.1%上升到25.3%精神分裂症在大型数据集,从9.8%到12.0%在大型数据集多发性硬化症。类似的精度相对提高观察三个额外的大型疾病样本数据集和非欧洲的精神分裂症。中将在现有方法的优势会随着样本量的增加。

数据

图1
预测精度的P + T用于模拟基因型和没有LD P + T)的性能,基于LD-pruned prs单核苷酸多态性(r ²< 0.2)其次是p值的阈值优化的阈值,当应用于模拟基因型有或没有有限的预测准确性,以平方关系真正的表型和prs(预测R ²),是策划作为训练样本大小的函数。模拟结果平均超过1000和200000个模拟基因型特征,分数的因果变异p被允许不同。在(A),模拟基因型是链接。在(B),模拟基因型有关;我们模拟独立批100标记而修复平方相邻的变量之间的相关性在一批0.9。

图2
比较四种预测方法应用于模拟特征预测精度表S1中列出的四种不同的方法应用于模拟特征时WTCCC基因型。四个subfigures对应p= 1 (A),p= 0.1 (B),p= 0.01 (C)p= 0.001 (D)模拟分数的因果标记(非零)效果大小从高斯分布采样。援助的解释结果,我们绘制精度对有效样本大小,定义为 $N_{eff} = (N / 米_{sim卡}) 米$ ,在那里N= 10786是训练样本的大小,*M =*376901是单核苷酸多态性的总数 $米_{sim卡}$ 是实际使用的snp数量在每个仿真:376901(所有染色体),112185(染色体1 - 4),61689(染色体1和2),和30004年(染色体1)。有效样本量样本大小,保持相同的吗N/米比如果都使用单核苷酸多态性。

图3
比较的方法应用于七WTCCC疾病数据集不同方法的预测精度估计从5倍交叉验证七WTCCC疾病数据集:1型糖尿病(近年来),类风湿性关节炎(RA)、克罗恩病(CD)、双相情感障碍(BD), 2型糖尿病(T2D)、高血压(HT)和冠状动脉疾病(CAD)。Nagelkerke预测R ²在y轴上显示其他指标(见表S2)。中将显著提高预测精度的几种疾病近年来,风湿性关节炎,CD(见正文)。

图4
比较的方法训练大GWAS汇总统计数据显示了五个不同的疾病预测精度为五个不同的疾病:精神分裂症(SCZ),多发性硬化症(MS)、乳腺癌(BC), 2型糖尿病(T2D)和冠状动脉疾病(CAD)。风险分数训练大GWAS摘要统计信息数据集,用于预测疾病风险的独立验证数据集。Nagelkerke预测R ²在y轴上显示其他指标(见表S5)。相比LD修剪+阈值(P + T),中将提高了预测R ²11% -25%。SCZ SCZ-MGS验证的结果显示队列用于最近的研究,但也中将产生很大的改善独立SCZ-ISC验证队列(表S5)。

看到这张图片在PMC和版权信息

类似的文章

非参数多基因风险预测通过分区GWAS汇总统计。
春,Imakaev M,回族D, Patsopoulos NA,尼尔BM, Kathiresan年代,Stitziel Sunyaev SR。春,等。 J哼麝猫。2020年7月2日,107 (1):46-59。doi: 10.1016 / j.ajhg.2020.05.004。2020年5月28日Epub。 2020年J哼麝猫。。 PMID:32470373 免费的PMC的文章。
北极星:多基因LD-adjusted风险评分方法基于集合的GWAS的分析数据。
贝克E,施密特公里,西姆斯R,马路MC,威廉姆斯J,霍尔曼P, V Escott-Price,财团WTG。贝克E, et al。麝猫论文。2018年6月,42 (4):366 - 377。doi: 10.1002 / gepi.22117。Epub 2018年3月12日。麝猫论文。2018。 PMID:29532500 免费的PMC的文章。
多基因通过贝叶斯预测回归和持续收缩先知先觉。
通用电气T,陈CY,倪Y,冯丫,Smoller表示JW。通用电气T, et al。 Nat Commun。2019年4月16日,10 (1):1776。doi: 10.1038 / s41467 - 019 - 09718 - 5。 Nat Commun》2019。 PMID:30992449 免费的PMC的文章。
新的统计方法利用精神分裂症的多基因结构——对潜在的神经生物学的影响。
王肖克AJ, Y,汤普森工作,戴尔,Andreassen OA。肖克AJ,等。当今一般人。2016年2月,36:89 - 98。doi: 10.1016 / j.conb.2015.10.008。Epub 2015年11月8日。当今一般。2016。 PMID:26555806 免费的PMC的文章。审查。
多基因的进展综合得分在阿尔茨海默氏症和其他复杂的疾病。
严Chasioti D J, Nho K, Saykin AJ。 Chasioti D, et al。趋势麝猫。2019年5月,35 (5):371 - 382。doi: 10.1016 / j.tig.2019.02.005。Epub 2019年3月25日。 2019年趋势麝猫。。 PMID:30922659 免费的PMC的文章。审查。

看到所有类似的文章

引用的

克服回归使用多基因的指数衰减的偏见。
范Kippersluis H, Biroli P,迪亚斯佩雷拉R, Galama TJ,冯Hinke年代,Meddens SFW, Muslimova D,懒汉EAW, de R“Vlaming”而来,里特维德CA。范Kippersluis H,等。 Nat Commun。2023年7月25日,14 (1):4473。doi: 10.1038 / s41467 - 023 - 40069 - 4。 Nat Commun》2023。 PMID:37491308 免费的PMC的文章。
挑战在研究基因和环境的相互作用。童年的研究金融危机缓和遗传易感性峰值吸烟。
五角L, Biroli P, Galama TJ,托姆K。五角L,等。 J经济学Psychol。2023年10月,98:102636。doi: 10.1016 / j.joep.2023.102636。2023年5月5日Epub。 J经济学Psychol》2023。 PMID:37484514
神经性厌食和炎症性肠diseases-Diagnostic和遗传关联。
拉森JT, Yilmaz Z, Vilhjalmsson BJ,桑顿LM,百诺我,棉布KL;饮食紊乱精神基因研究团的工作小组;Werge T, Hougaard DM,莫滕森PB Bulik厘米,彼得森LV。拉森JT, et al。 JCPP放置于2021年9月27日,1 (4):e12036。doi: 10.1002 / jcv2.12036。eCollection 2021年12月。 2021年JCPP放置。 PMID:37431410 免费的PMC的文章。
纵向multi-omics研究揭示了常见的病因基础血浆蛋白质组之间的联系和BMI轨迹在青少年和年轻成人的双胞胎。
Drouard G, Hagenbeek FA,惠普尔池R, Hottenga JJ,詹森R, huber N, Afonin;BIOS财团;BBMRI-NL代谢组学的财团;Willemsen G, de Geus EJC Ripatti年代,Pirinen M, Kanninen公里,Boomsma DI,凡·通根于J, Kaprio J。 Drouard G, et al。 medRxiv。2023年7月1:2023.06.28.23291995。doi: 10.1101 / 2023.06.28.23291995。预印本。 medRxiv。2023年。 PMID:37425750 免费的PMC的文章。
最优策略学习multi-ancestry得分多基因的不同特征。
莱曼B,麦金托什米,McVean G,福尔摩斯C。莱曼B, et al。 Nat Commun。2023年7月7、14 (1):4023。doi: 10.1038 / s41467 - 023 - 38930 - 7。 Nat Commun》2023。 PMID:37419925 免费的PMC的文章。

看到所有“引用”的文章

发布类型

行动
行动

网格计算

行动
行动
行动
行动
行动
行动
行动
行动
行动
行动
行动
行动

引用保存到文件

电子邮件引用

添加到收藏

加入我的参考书目

保存的搜索

创建一个外部引用的文件管理软件

你的RSS提要

建模连锁不平衡增加多基因风险评分的准确性

建模连锁不平衡增加多基因风险评分的准确性

文摘

数据

类似的文章

引用的

发布类型

网格计算

给予的支持

LinkOut——更多的资源

全文来源

其他文献来源

医疗

研究材料

文摘

数据

类似的文章

引用的

发布类型

网格计算

相关信息

给予的支持

LinkOut——更多的资源

全文来源

其他文献来源

医疗

研究材料