摘要
结节病是一种病因不明的复杂全身性炎症性疾病,受多种遗传和环境因素的影响。
为了进一步确定结节病的易感位点,基于Affymetrix 100k基因芯片数据,对381名患者和392名对照个体进行了全基因组关联研究(GWAS)。选择前25位单核苷酸多态性(SNPs)在一个独立研究小组(1582名患者)中进行验证与1783年控制)。
染色体变异rs104844106p12.1与Bonferroni校正的p值2.90×10显著相关−2在验证样品中,标称p值为2.64×10−4在GWAS。对新位点的广泛精细定位将信号缩小到包含这些基因的区域BAG2,C6orf65,KIAA1586,ZNF451和RAB23.在进一步的独立病例对照和定量mRNA表达研究中,对结节病相关的非同义SNP rs1040461的验证指出RAB23基因是最可能的危险因素。RAB23被提议参与抗菌防御过程和调控超音hedgehog基因信号通路。
确定的关联6p12.1结节病位点暗示该位点是一个进一步的易感因子,RAB23是一个潜在的信号成分,可能为结节病的病理生理学开辟新的前景。
结节病(人类孟德尔遗传(MIM)181000)是一种多系统疾病,具有成为慢性病的高风险,其特征是非鳞状上皮细胞肉芽肿,几乎可以在任何器官系统中表现出来,最常见于肺。它被称为年轻成人疾病,根据种族和地理位置,年发病率在每100000人中<1-64例图形区[1].结节病的病因尚不清楚,但据认为是由复杂的环境因素引起的[2,3.和遗传因素[4].双胞胎和家庭研究提供了强遗传成分的证据,这些研究表明,同卵双胞胎结节病的一致性高于异卵双胞胎(0.148)与0.012),遗传率为66% [5]结节病的遗传基础进一步得到位于人类白细胞抗原(HLA)区域的已知遗传危险因素的支持(综述见[6])以及第一个被证实的易感基因的发现butyrophilin-like 2(BTNL2;MIM 606000)在6号染色体上[7,8].除了这些疾病位点外,许多潜在候选区域的关联研究还提出了其他易感基因,如趋化因子受体趋化因子受体2(CCR2;MIM 601267)和趋化因子受体5(CCR5;MIM 601373),的肿瘤坏死因子-α(TNFA;MIM 191160)和其他几个HLA位点(综述见[4,6])。但是,其中许多显示了相互冲突的结果或等待复制。最近,我们发现annexinA11(ANXA11在使用Affymetrix 5.0芯片的全基因组关联研究(GWAS)中,MIM 602572)作为结节病的进一步疾病相关基因(美国加利福尼亚州圣克拉拉市Affymetrix)[9].此外,我们在染色体上发现了一个结节病和克罗恩病共有的易感位点(MIM266600)10 p12.2,根据Affymetrix对这两种疾病的100k GWAS扫描的联合分析[10].
100k和5.0芯片只共享其单核苷酸多态性(SNPs)的一小部分(100k阵列SNPs中<15%也存在于5.0集)。因此,我们分析了我们的100k结节病数据集,该数据集以前只是克罗恩病联合分析的一部分(汇总数据)[10,以识别由于标记覆盖差异而无法被5.0芯片检测到的敏感位点。
方法
患者招募和表型分析
如前所述,招募了A组(GWAS)、B组(验证)和C组(精细mapping)的德国结节病患者[7,9,11](详情请参见在线补充材料中的附录S2)。参与患者的诊断基于结节病国际共识声明[12],组织学显示受累器官(最常见的是肺)有非坏死性肉芽肿。在没有组织学支持的情况下,只招募了经典Löfgren综合征的患者。根据疾病的临床表现,如前所述,患者分为慢性结节病或急性结节病[13]在精细定位阶段进行的亚表型特异性分析中,排除了无法明确分类的患者(n=210)。A组、B组和C组的德国对照个体来自PopGen生物银行(加拿大魁北克省蒙特利尔市)[14]小组D(复制)包括来自不同欧洲地区的结节病患者,这些患者是在欧洲网络结节病基因型-表型关系(GenPhenReSa)中招募的(详情见在线补充材料中的确认部分和附录S1)和德国对照组(n=2564)如先前详细报告所述,这些人员已被招募[15].
有关SNP基因分型和选择、统计分析、RT-PCR组织特异性表达分析、支气管肺泡灌洗液细胞样本、mRNA分离和实时PCR的信息,可在在线补充材料的附录S3–S10中找到。
后果
GWAS分析
在对数据集应用保守且已建立的质量过滤器(见方法部分)后,773个德国样本(381例和392例对照)和97088个SNP被纳入筛查阶段的关联分析。在标称显著性水平为0.05时,实验有63%预备假设疾病相关等位基因在对照组中出现的频率为20%(见在线补充材料中的图S3),则可以检测比值比(OR)≥1.5的变异。估计的群体分层较小,基因组膨胀因子λGC=1.076(1.0表示无通货膨胀)。随后的关联结果根据卡方检验统计中的通货膨胀进行校正;生成的分位数-分位数图如所示图1.
铅变体的验证
在独立验证小组B(1783名德国对照和1582名德国结节病患者)中,对筛查阶段通过上述标准(见方法部分)的25个snp进行了基因分型。这些snp的关联分析结果显示在表1包括基因型计数在内的完整分析结果列在在线补充材料的表S1中。只有一个标记,染色体上的rs104844106p12.1,通过了Bonferroni修正多次测试(修正后的p=25×1.17×10−3= 2.90×10−2)与结节病显著相关(另见染色体全基因组图;在线补充材料中的图S4)。rs10484410罕见G等位基因的等位基因或为1.26(95%可信区间1.10–1.44).只有5.8%的对照个体rs10484410的风险等位基因G纯合子,而结节病病例中有7.1%为纯合子。
扫描没有证实我们先前报道的结节病与癌症的关系BTNL2[7),ANXA11[9在放映时。这两个位点在独立的欧洲人群中被复制(ANXA11[19),BTNL2[20])在美国人中也是如此(BTNL2[8),可以被认为是真实的联想。然而,没有一个单一的SNPANXA11或者在BTNL2基因存在于Affymetrix genchip®Human Mapping 100k集合中,显示与500K阵列集合的标记重叠小于15%。相反,在以前发表的GWAS使用Affymetrix 5.0芯片[9],先导SNP rs10484410本身未被包含在内,而rs1044670 (SNP_A-1824553;p = 9×10−3)与精细制图阶段密切相关。然而,在之前的GWAS中,SNP的排名非常低(排名6229)。验证阶段的结果采用TaqMan基因分型作为独立技术进行验证(>99.8%基因型一致性)。
精细映射rs10484410 (6p12.1)
除先导SNP rs10484410外,筛选出44个HapMap标记SNPs (tagSNPs)进行~ 800 kb的精细定位6p12.1在C组中进行的区域(见方法部分)。44个SNP中有41个通过了上述质量标准(见方法部分).在分析中,9个标记物的p值<0.05;详细结果,包括整个结节病组的基因型计数,见在线补充材料中的表S2。由于C组分析的目的是确定可能的关联信号源,因此多次测试的结果未得到校正这是在B组中确定的。在慢性表型和急性表型之间,在所测试的标记物上没有观察到一致的关联信号显著性差异(见在线补充材料中的表S2和S3)。
rs10484410和另外九个与C组显著相关的SNP之间的连锁不平衡(LD)差异很大(r2= 0.41–0.99; 见在线补充材料中的表S2)。在10个标记中,SNP rs1411578的关联性最强(p=6.64×10)−4).标记rs1411578 (G>C)位于ras相关蛋白Rab23 (RAB23;MIM 606144)。次要G等位基因在受影响个体和对照受试者中的频率分别为17%和14%,3.5%的患者和2%的对照个体为纯合子。图2概述了该基因的关联信号、保守性状态、基因和LD结构6p12.1轨迹。
区域关联图和连锁不平衡结构6p12.1轨迹。a) c图中先导变异rs10484410(绿色圆圈)附近800-kb区域精细作图(FM)获得的p值的负自然对数图。FM中最显著相关的单核苷酸多态性(SNPs)用蓝色垂线突出。在1806名对照和1837名结节病患者中对44个标记snp进行了基因分型。C组分析和经验证的100k全基因组关联研究(GWAS)的名义p值导致SNP rs10484410(381例结节病病例)与392控制;面板A)如图所示。红色虚线对应0.05的显著性阈值。职位是在国家生物技术信息中心建立36.1座标。详见在线补充资料中的表S1和S2。b)绘制重组率(每兆位酶(Mb)厘米器官(cM))和累积遗传距离(cd)。c)基于44种不同脊椎动物的序列保护评分(取自加州大学圣克鲁兹分校(Santa Cruz, CA, USA) Genome Browser,脊椎动物Multiz Alignment and conservation)。d)潜在基因的位置及内含子/外显子结构。DST: dystonin。e)以r测量的成对LD2在通过质量标准的基因型变异的研究样本中,包括GWAS铅SNP rs10484410(n=76)。
扩展精细映射
因为第一个精细映射阶段的结果表明RAB23,根据单倍型图数据,在57190 kb和57271 kb位置处,通过重组率增加的基因座清晰地描绘出(图2 b),我们的目的是确保关联信号仅限于RAB23因此,我们对来自C组的样本进行基因分型,以获得另外46个基于单倍型CEU的tagSNPs,这些tagSNPs覆盖了∼围绕先导SNP rs10484410和RAB23基因组区域(在线补充材料中的表S3)。
查看总映射区域(∼900 kb),最显著相关的SNP是rs7756421,位于锌指蛋白451(ZNF451)基因。该标记是高LD (r2≥0.8),其中包括八个其他相关变量(p≤0.001)该映射到RAB23(rs11398、rs1411578、rs1547226和rs3800018),ZNF451(rs6459178、rs17619360和rs10484410)和非基因区(rs12190575)(图3).一个非同义SNP(nsSNP)(rs1040461)在RAB23具有显著相关性的基因(名义p值(p笔名) = 7.83×10−3)与结节病也不属于这组高度相关的标记。
连锁不平衡(LD)结构概述6p12.1位点,包括最显著的结节病相关单核苷酸多态性(SNPs)和非同义标记rs1040461(c.619G>A)RAB23基因。最显著相关SNP rs7756421和名义p值<0.001的SNP以及聚焦区域的非同义SNP rs1040461之间的两两LD。LD的估计是基于精细定位阶段的基因型数据(图C), LD的强度与颜色对应。
我们采用了基于信息准则的逆向模型选择方法伊凯克[21的逻辑回归分析,以确定是否所有这9个重要信号都可以通过LD归因于一个或多个潜在的致病变异。模型选择证实了观察到的所有高度相关SNPs的关联信号都是单一来源的。如果显著相关的nsSNP rs1040461也被纳入,那么在选择后,它仍然留在模型中,因此可能代表一个独立的关联信号。
rs10484410、rs7756421、rs1040461的复制
GWAS领先于SNP rs10484410,在精细映射区域(rs7756421)中关联性最强的SNP和在精细映射区域中关联性最强的nsSNP rs1040461RAB23基因在D组进行基因分型以进行复制。我们将我们小组中的每个人分配到其他地方描述的欧洲数据集中最近的亚群[22],随后纳入该参考面板全基因组数据的前六个主成分(PCs)的亚群体特异性平均值,以调整群体分层。在不调整取样位置的情况下,标记rs10484410和rs7756421在等位基因水平上显示与结节病显著相关(p笔名= 3.30×10−3和p笔名= 5.10×10−3然而,在将前六个PC纳入模型后,rs1040461显示p笔名= 1.05×10−2,在多次测试校正后仍然显著,而其他两个标记物变得不显著(prs10484410= 1.40×10−1和prs7756421= 1.80×10−1;表2).仅对德国病例和对照组的分析得出rs1040461的类似结果(p=1.20×10−3不调整取样位置,p=1.05×10−2调整后),但其他两个指标的显著性略有下降(prs10484410= 6.90×10−2和prs7756421= 8.50×10−2无需调整,prs10484410= 1.40×10−1和prs7756421= 1.80×10−1调整)。
候选基因的表达分析
为了通过合理的生物学推理缩小关联信号的范围,五个基因的转录水平(BAG家族分子伴侣调节器2 (BAG2;MIM 603882),BEN结构域蛋白6(C6orf65;BEND6),非特征蛋白KIAA1586,ZNF451和RAB23)首先通过RT-PCR在一组不同的人体组织中对位于精细定位区域的基因进行评估。如所示图4只有RAB23和ZNF451肺高表达,而BAG2和KIAA1586该组织的表达量明显较低。C6orf65mRNA只能在脑组织和少数其他组织中以极低的水平检测到RAB23在小肠和结肠粘膜中也变得明显。
组织内基因的特异性表达谱6p12.1风险位点。采用RT-PCR技术对候选基因的表达进行了分析。管家基因GAPDH用于内部控制。
接下来,我们使用定量实时PCR和结节病患者和对照组(每组n=5)的cDNA分析来自支气管肺泡灌洗(BAL)的细胞中候选基因的表达水平。如图5, 5个候选基因中有4个在BAL细胞中表达C6orf65(BEND6) mRNA未检测到。最有趣的是,统计分析只揭示了这一点RAB23患者与对照组的相对表达水平有显著差异(p=2.94×10)−3基于Mann–Whitney U-非参数数据检验)。与对照组相比,结节病患者的BAL细胞表现出高达三倍的RAB23进一步强调该基因可能参与结节病的发病机制。
a)的相对表达式BAG2,b)KIAA1586c)ZNF451和d)RAB23在支气管肺泡灌洗(BAL)细胞中。从结节病患者和匹配的健康对照组中提取BAL细胞样本(每组n=5)。从BAL细胞中提取的cDNA通过实时荧光定量PCR和序列特异性引物检测候选基因的相对表达。表达水平正常化的管家基因内参(ACTB).相对表达水平用箱形图表示,代表五个测量值的中位数和范围。使用非参数Mann-Whitney u检验计算差异的显著性水平。只有RAB23患者和对照组之间的表达差异非常显著,相对表达增加了3到4倍。#: p = 3.20×10−3.
进一步的表达分析见在线补充材料中的表达数量性状位点(eQTL)结果(图S5A-S7C)。
讨论
我们在染色体上发现了一个新的结节病易感位点的证据6p12.1这包含了五个候选基因C6orf65(BEND6),BAG2,KIAA1586,ZNF415和RAB23这一结果是通过分析带有>97000个SNP标记的全基因组病例对照关联扫描数据以及对验证区域的广泛精细定位获得的。扫描没有确认结节病位点ANXA11这是最近使用Affymetrix 5.0芯片发现的。没有一个SNPANXA11在Affymetrix genchip®Human Mapping 100k组中,与5.0组的标记重叠小于15%。相反,5.0芯片覆盖了染色体上新发现的风险位点6p12.1有16个SNP,包括高度相关的SNP rs1044670。尽管这是一个真实的信号,但SNP在之前的GWA中排名低于任何可行的复制截止值(排名6229),因此未经验证。
检测到的GWAS导联SNP rs10484410的稀有等位基因的等位基因或中等(1.26)。我们必须在此指出,结节病在普通人群中的低发病率极大地限制了可用样本的数量。反过来,招募足够的样本以实现遗传因素的全基因组意义,从而传递中到小风险或低等位基因频率,可能是不可行的。在这方面,我们的研究y设计(以GWAS作为假设生成步骤,在验证阶段为多个测试引入一个小的校正因子)能够检测结节病的低风险因素。
新位点的精细定位显示结节病与LD高传播的小区域的几个SNPs密切相关C6orf65(BEND6),在ZNF451,RAB23.在这些SNPs中,有4个推测的功能变异:rs1044670 (c.*1109G>A),位于C6orf65(BEND6);rs1411578 (c.*416G> c)在3'UTR和rs1040461 (c. 619g >A)在第7外显子RAB23;和rs7756421 (c.*742A>G)在3'UTR的ZNF451基因。Logistic回归分析表明,关联信号可能主要是由多个变量驱动的RAB23包括错义突变rs1040461。该SNP通过甘氨酸的氨基酸取代小的极性氨基酸丝氨酸(G207/207)在基因的非结构域包含区域。在进一步的研究中发现,标记rs1040461,而不是rs7756421或GWAS引导的SNP rs10484410,似乎与几个欧洲人群的结节病有关。这一发现有力地支持了rs1040461是真正结节病风险变异的假设。
组织特异性mRNA表达谱分析显示健康肺中RAB23和ZNF451水平较高。此外RAB23是否唯一的候选基因在结节病患者和对照之间的相对表达有高度显著差异,表明可能参与RAB23在疾病发病机理。我们的研究结果的病理生理学相关性由eQTL分析表明,该分析确定了疾病相关过程中的变化(如。对外部刺激的反应、细胞防御反应和代谢过程)对所呈现的遗传变异的反应RAB23rs1040461变异或相关区域的另一种潜在致病变异的结果,确实为阐明该基因作用的未来研究提供了一个有价值的起点RAB23及其在结节病发病机制中的变异。
的RAB23基因属于rabb家族的160个小鸟苷三磷酸酶,调节膜相关蛋白的细胞内运输[23,24].基于微阵列表达数据(UCSC GNF expression Atlas 2 data和Affymetrix All外显子微阵列;请参阅在线补充材料中的URL 8),RAB23除子宫和小脑组织外,在支气管上皮细胞和甲状腺细胞中表达较高。这似乎与我们在肺组织中的表达结果一致(见前面)。
该位点在结节病发病机制中的潜在作用尚不清楚,目前只能作为一个有效的假设提出。结节病是一种系统性免疫疾病,其中T细胞介导的炎症导致肉芽肿的形成,类似于迟发性超敏反应。迟发性超敏反应与作用可能是由细胞内存在化学或微生物来源的抗原引起的。许多报告描述了结节病患者组织中存在微生物细胞壁因子,一些临床研究表明结节病患者中存在微生物[25,26].自RAB23在内源性自噬机制的抗菌活性中发挥作用[27,从生物学上讲,肺上皮暴露于病原菌后,功能障碍可能导致自噬清除功能受损。的高表达RAB23不仅在肺中,而且在小肠和结肠粘膜中,可能指出了更广泛的潜在作用RAB23研究上皮屏障器官的抗菌防御机制。
然而,RAB23蛋白也参与促进囊泡转运,控制向溶酶体的内吞进展[27,28],特别是在神经系统中拮抗sonic hedgehog (Shh)信号转导[29,30].有趣的是,Shh通路也可能在慢性肺纤维化和免疫系统通讯中发挥作用[31],从而就RAB23在结节病中,已经在成人免疫系统中确定了Shh级联的组成部分,参与CD4+T细胞活化,对纤维化肺疾病的研究表明,Shh在人类和小鼠肺中仅限于活动性疾病区域(综述见[32])。假设Shh信号可能有助于上皮细胞的修复,并可能在受损上皮细胞和免疫/炎症系统之间的交互中起到中介作用。在结节病中,活化的肺T-helper 1型细胞对炎症过程至关重要,在结节病活动性疾病患者的BAL液中可以发现特定的CD4+ t细胞亚群水平显著升高。有可能RAB23在肺结节病中,Shh途径内的功能障碍导致CD4+T细胞过度激活或受损肺的修复过程不充分,从而导致疾病。
尽管有证据表明RAB23由于对结节病的易感性,也可能是致病变异位于ZNF451,C6orf65(BEND6)或者另一种尚未定义的遗传因素。ZNF451,亦称过山车,KIAA0576和起亚1702,在脊椎动物中是保守的,广泛表达,并被认为是类固醇受体的共激活物;它也可能参与转录调控[33].假定的基因C6orf65(BEND6)是一个复杂的位点,它似乎能产生几种没有序列重叠且功能未知的蛋白质。
总而言之,这是第一篇关于结节病与癌症之间关系的报道6p12.1由几个基因组成的基因座,一个可能的候选者RAB23.这一观察的重要性应该通过进一步描述的生物学作用来评估RAB23结节病。
致谢
GunpReSa联盟的成员是G·G·N瑟(损坏的中心,吉森大学,Giessen,和肺诊所WaldHof El GelsHuSun,格赖芬施泰因,德国),A. Dubaniewicz(格但斯克肺医科大学,格但斯克医科大学,格但斯克,波兰),S. Pabst(医学诊所II,呼吸科,波恩大学,波恩,德国),D. Bumbacea(马吕斯NASTA肺科学研究院,布加勒斯特,罗马尼亚),A. Prasse和A. Grubanovic(肺科,大学医学中心,阿尔布雷希特-鲁德维格斯大学,弗莱堡,德国),P. Rottoli和E. Bargagli(呼吸疾病科,临床医学和免疫学,锡耶纳外国人大学,锡耶纳,意大利),P. Bresser(Pultul学,学术医疗中心,阿姆斯特丹,荷兰),V. Poletti(OsPalaleGB Mgaligi,DelpTimeto Di MalATTE Del'呼吸器EDE TraseUO内窥镜TuraCa,弗利,意大利),M. Luisetti(临床MalATTITE呼吸器,Irccs CurruliCo San MaTeo PaVIAS,帕维亚大学,帕维亚,意大利)和V.Vucinic和J.Videnovic Ivanov(塞尔维亚贝尔格莱德贝尔格莱德医学院)。
作者希望感谢所有患者、家属和医生的合作。感谢德国Sarkoidose Vereinigung eV(德国米尔布施)、PopGen Biobank(加拿大QC蒙特利尔)和贡献的肺科医生的支持。最后,我们感谢临床分子生物学研究所的工作人员(德国基尔)寻求技术援助。
脚注
这篇文章的补充材料可从www.www.qdcxjkg.com
支持声明
实验是在德国基尔的christian - albrecht大学的临床分子生物学研究所进行的。这项研究是支持由德国联邦教育和研究部门(BMBF)在国家基因组研究网络(NGFN)(批准号01 gs0426和01 gs0809)和德国研究基金会(DFG)通过卓越的集群“炎症在接口”以及通过项目脱硫μ692/8-1和μ692/7-1。
利益陈述书
没有人申报。
- 收到2011年1月5日。
- 接受2011年4月2日。
- ©2011人队