广告
浏览学科领域

点击公共科学图书馆分类法,找到你所在领域的文章。

有关PLOS学科领域的更多信息,请单击在这里

  • 加载指标

外周血基因表达在复杂结节病中的应用

  • 通周,

    对这项工作做出同样贡献的还有:周通、张伟

    从属关系个性化的呼吸医学研究所,伊利诺伊大学芝加哥,芝加哥,伊利诺斯州,美国,部分肺,急救护理,睡眠和过敏,医学系,伊利诺伊大学芝加哥,芝加哥,伊利诺斯州,美国

  • (音译),

    对这项工作做出同样贡献的还有:周通、张伟

    从属关系人类遗传学,芝加哥伊利诺伊大学,芝加哥,伊利诺伊州,美国,儿科,芝加哥伊利诺伊大学的系,芝加哥,伊利诺伊州,美国研究所

  • Nadera j . Sweiss

    联系伊利诺伊大学,芝加哥,伊利诺伊州伊利诺伊州伊利诺伊大学风湿病学系

  • 爱德华S.陈,

    联系美国马里兰州巴尔的摩市约翰·霍普金斯大学医学系肺科和重症医学科

  • 大卫·r·莫勒

    联系美国马里兰州巴尔的摩市约翰·霍普金斯大学医学系肺科和重症医学科

  • 肯尼斯·s·诺克斯

    联系美利坚合众国,亚利桑那州,图森,亚利桑那大学,内科,肺和重症护理科

  • Shwu-Fan妈,

    联系肺/危重病急救医学系,芝加哥大学,芝加哥,伊利诺伊州,美国的科

  • 迈克尔·s·韦德,

    从属关系个性化的呼吸医学研究所,伊利诺伊大学芝加哥,芝加哥,伊利诺斯州,美国,部分肺,急救护理,睡眠和过敏,医学系,伊利诺伊大学芝加哥,芝加哥,伊利诺斯州,美国

  • 因诺斯,

    联系肺/危重病急救医学系,芝加哥大学,芝加哥,伊利诺伊州,美国的科

  • 罗伯特·f·马查多,

    从属关系个性化的呼吸医学研究所,伊利诺伊大学芝加哥,芝加哥,伊利诺斯州,美国,部分肺,急救护理,睡眠和过敏,医学系,伊利诺伊大学芝加哥,芝加哥,伊利诺斯州,美国

  • 乔·G·N·加西亚

    jggarcia@uic.edu.

    从属关系个性化的呼吸医学研究所,伊利诺伊大学芝加哥,芝加哥,伊利诺斯州,美国,部分肺,急救护理,睡眠和过敏,医学系,伊利诺伊大学芝加哥,芝加哥,伊利诺斯州,美国

外周血基因表达在复杂结节病中的应用

  • 通,
  • (音译),
  • Nadera j . Sweiss
  • 爱德华S.陈,
  • 大卫·r·莫勒
  • 肯尼斯·s·诺克斯
  • Shwu-Fan妈,
  • 迈克尔·s·韦德,
  • 因诺斯,
  • 罗伯特·f·马查多
公共科学图书馆
x

摘要

结节病是一种全身肉芽肿综合征,常累及肺,通常会自行缓解,但约有20%的病例进展为严重的肺功能障碍或心脏和神经系统受累(复杂结节病)。不幸的是,目前的生物标志物无法区分缓解期(不复杂的)结节病患者与其他纤维化性肺疾病,也无法识别复杂结节病的风险个体。我们利用全基因组外周血基因表达分析,确定了一种20个基因的结节病生物标志物标记,可区分结节病(n = 39)和健康对照(n = 35,分类准确率为86%),并可作为复杂结节病的分子标记(n = 17)。由于T细胞受体(TCR)信号、JAK-STAT (JS)信号和细胞因子-细胞因子受体(CCR)信号的异常与结节病的发病有关,由31个与结节病相关的T细胞信号通路基因组成的标记(TCR/JS/CCR)与无偏性的20个基因标记进行了比较,但在区分复杂结节病与非复杂结节病时,证明其预测准确性较差。其他验证策略包括特征基因的单核苷酸多态性(SNPs)与结节病的易感性和严重程度的显著关联(无偏特征基因-CX3CR1,FKBP1A,,RBM12B.,SENS3,TSHZ2.;T细胞/JAK-STAT通路基因AKT3,CBLB.,DLG1,IFNG,IL2RA,IL7R,ITK,小君,MALT1,NFATC2,PLCG1,SPRED1).总之,这种验证的外周血分子基因签名似乎是鉴定酸性肿性的病例和预测复杂结节病的风险的有价值的生物标志物。

介绍

结节病是一种起源不明的全身性炎症性肉芽肿性疾病,累及多个器官和肺部[1],[2],通常是自发的分辨率。然而,受影响的个人的约20%出现进行性疾病的呼吸,心脏或神经系统受累。复杂结节病被定义为表现出无论是心脏表现(例如,室性心律失常)[3],神经受累(例如,与高密度MRI损伤的证据)[4]或肺功能恶化(如FVC <50%)。目前,fda批准的治疗复杂结节病的方法还不存在,皮质类固醇和保留皮质类固醇的免疫抑制剂(TNFα抑制剂)的成功有限[5].准确识别复杂结节病患者是一项棘手的临床挑战,试图定义临床有用的生物标志物大多不成功。我们迫切需要结节病生物标记物来为复杂结节病患者提供靶向治疗,并确定患者因复杂结节病而存在发病率增加和显著死亡率的风险。

以往对结节病候选基因的研究主要集中在肉芽肿形成和免疫反应途径,涉及几个与结节病易感性相关的基因[6]包括HLA抗原,如I类HLA- b8[7]和hla-drb1[6],[8],[9].参与抗原加工、抗原呈递、巨噬细胞和t细胞活化以及损伤修复的其他候选基因也与结节病的易感性有关[10]- - - - - -[23].全基因组扫描研究基于无偏性、基于基因组的方法,通过连锁分析确定了与结节病易感性有关的基因(例如,63个有患病兄弟姐妹的德国家庭的D6S1666)。[24]进一步扫描建议rs2076530英寸BTNL2(butyrophilin-like 2)基因可能与结节病的发生有关[25].然而,在评估特定高危人群的结节病易感性以及识别有复杂、进展性疾病风险的结节病患者方面仍然存在重大挑战。

我们的研究旨在通过比较非裔美国人(AA)和欧洲血统血统(EA)结节病病例的全基因组基因表达数据来识别新的基因组生物标志物。我们发现了一种通用的基因特征,可将结节病患者与健康对照者区分开来,并将复杂结节病(肺- FVC<50%,心脏或神经系统结节病)与非复杂结节病区分开来。与由T细胞受体-先天免疫途径(包括先前与结节病相关的基因)内的基因组成的第二个标记相比,该基因标记在AA和EA群体中的预测准确性更高。这些特征将结节病患者与特发性肺纤维化(IPF)病例区分开来,特征基因的遗传变异与结节病易感性的显著关联提供了特征验证。这些结果突出了外周血分子基因标记作为预测复杂结节病风险个体的有价值的生物标志物的作用,并可能促进这种神秘疾病的个体化治疗。

结果

病人的特点

从结节病患者(n = 39)和健康对照组(n = 35)采集PBMC样本(表1).研究患者的临床特征显示在表2.未合并结节病与合并结节病在年龄、性别、种族、肺功能等方面无显著性差异(性别χ2检验P>0.05,其他特征t检验P>0.05)。无并发症结节病病例倾向于较高的皮质类固醇使用,而复杂结节病病例倾向于较高的甲氨蝶呤使用,并更有可能接受抗tnf α治疗。但差异无统计学意义(P>0.05) (表2).可以预见,与其他研究组相比,复杂肺结节病患者的肺功能明显降低(数据未显示)。

缩略图
表1。研究对象的种族和复杂性状况。

https://doi.org/10.1371/journal.pone.0044818.t001

结节病差异表达基因的鉴定

所有诊断为心脏、神经系统或严重肺结节病(FVC<50%)的病例都包括标记为“复杂结节病”的队列。在指定的显著性水平(倍变化>1.4,q值<0.05),在合并样本(合并AAs和EAs)中,所有结节病病例与健康对照之间有316个基因的差异表达。在个体群体中,所有AA病例和对照之间有118个基因差异表达,而所有EA病例和对照之间有861个基因差异表达。相比之下,在合并样本中,复杂结节病病例和健康对照之间有1124个基因表达差异。在个体群体中,AA组和EA组复杂结节病与健康对照之间分别有730个和980个基因表达差异,TCR信号通路在两个群体复杂结节病相关基因中均显著富集(校正后P<0.05) (图1一个).

缩略图
图1所示。确定结节病的基因签名。复杂的结节病相关的基因中面板A.富集途径。

排名最高的KEGG路径为每个人群列出。红线表示显著性截断(经调整的p-value<0.05)。每个途径中的基因数量显示在途径名称旁边。面板B.复杂的结节病和健康对照患者的热爱。红色表示基因表达增加;蓝色代表下调。“++”:合并结节病患者;“−”:健康对照组。C. 20个基因标记表达值的主成分分析.x轴:带有特征值的主分量1;y轴:具有特征值的主分量2。左图:合并结节病患者和健康对照组;中间组:合并结节病患者、非合并结节病患者及健康对照组;右图:合并结节病和非合并结节病患者。HC:健康对照组;美国:无并发症结节病患者;CS:合并结节病的患者。D. 20个基因签名与TCR/JS/CCR信号通路基因签名的比较。预测精度的分布是基于1000次5倍交叉验证。虚线表示20个基因签名或TCR/JS/CCR信号通路基因签名的平均分类精度。左图:所有结节病患者对健康对照;而右图:患者有复杂的结节病与患者简单结节病。

https://doi.org/10.1371/journal.pone.0044818.g001

鉴别复杂结节病的基因特征

为了识别AA和EA人群中复杂结节病的通用基因特征,我们使用支持向量机算法,初步分析了AA或EA复杂结节病病例与健康对照之间的1233个差异表达基因。图S1示出了预测精度的用于基因签名与递归特征选择过程中基因的数量的分布(参见补充文字S1详情)。20个基因的签名(表3)被选择为具有峰值预测精度的最具解析的签名(图S1),并准确区分复杂结节病患者与健康对照组(图1B和1C)或单纯结节病(图1 c).20个基因中有两个基因,HBEGF(肝素结合EGF样生长因子)和SAP30(sin3a相关蛋白,30kDa)在复杂结节病中表达强烈上调,而其余18个特征基因在复杂结节病中表达下调(图S1).在合并样本(AAs和EAs)中,非靶向20基因标记将所有结节病患者与健康对照组区分开来,准确率为86.0%(敏感性为88.2%,特异性为83.3%)(图1 d).AA和EA中结节病病例与健康对照的鉴别准确率分别为88.2%和94.2% (图S2).联合样本中鉴别合并结节病与非合并结节病的准确率为81.4%(灵敏度为87.0%,特异度为74.2%)(图1 d),但AA和EA合并结节病与非合并结节病的分离率分别为83.7%和64.5% (图S2).

缩略图
表3。复杂结节病的20个基因的无偏性特征。

https://doi.org/10.1371/journal.pone.0044818.t003

结节病相关TCR/JS/CCR信号通路基因特征的评估

作为T细胞受体通路(TCR), JAK STAT信号通路(JS)和细胞因子-细胞因子受体信号通路(CCR)都与结节病有关[6],[26],由与结节病相关的TCR/JS/CCR信号通路基因组成的31个基因标记被评估为识别复杂结节病病例或风险的潜在分子生物标志物(表4)(见补充文字S1详情)。总的来说,该TCR/JS/CCR信号通路特征可将结节病与健康对照人群区分开来,其预测准确率为82.2% (图1 d),但在区分复杂结节病与非复杂结节病时,预测准确率大幅降低,低于60% (图1 d).该TCR/JS/CCR特征对AA结节病患者与健康对照的鉴别准确率为83.2%,而对AA合并结节病与非合并结节病的鉴别准确率仅为69.7%。同样,在EA病例中,TCR/JS/CCR特征在区分结节病患者与健康对照中的准确率为75.1%,而在区分EA合并结节病患者与非合并结节病患者中的准确率仅为37.5%。EA和AA合并病例TCR/JS/CCR和无偏20基因标记预测准确率的比较(图1 d,图S3)显示无偏性20基因结节病特征表现较好(P<10−15通过t检验)。最后,由于结节病和IPF是最常见的未知病因间质性肺疾病(ILDs),我们评估了无偏性20基因和TCR/JS/CCR结节病基因标记区分结节病和IPF病例的能力(GEO - GSE38958)。在区分结节病和IPF病例时,每个标记对IPF和结节的预测精度相当,其中20个基因标记(77.2%)略优于TCR/JS/CCR信号通路标记(76.5%)(图S4P < 10−5通过t检验)。

缩略图
表4。结节病中31个差异表达的TCR/JS/CRR信号通路基因

https://doi.org/10.1371/journal.pone.0044818.t004

独立数据集的验证

我们在两个不同的独立结节病血液基因表达数据集中评估了我们的基因标记的性能。一个数据集(GEO - GSE19314)来自加州大学旧金山分校(UCSF)[27]另一个(GEO - GSE18781)来自俄勒冈健康科学大学(Oregon Health Sciences University)[28].辨别力是无偏的20基因和在两个数据集的TCR / JS / CCR签名之间非常相似。20基因签名从与75.9%的准确率和78.3%的USCF和俄勒冈数据集,分别健康对照分类结节病的情况下,而判别精度成为75.4%和80.0%时是在应用了该TCR / JS / CCR签名美中基金会和俄勒冈州的数据集,分别为(图2).再次,主成分分析表明,结节病患者可以从健康对照很好区分在两个独立的数据集,只是基于我们不偏不倚20基因签名的表达(图2).

缩略图
图2。独立数据集的验证。

上图为20个基因签名与TCR/JS/CCR信号通路基因签名的对比。预测精度的分布是基于1000次5倍交叉验证。虚线表示20个基因签名或TCR/JS/CCR信号通路基因签名的平均分类精度。下面的面板显示了20个基因标记表达值的主成分分析结果。x轴:带有特征值的主分量1;y轴:具有特征值的主分量2。

https://doi.org/10.1371/journal.pone.0044818.g002

利用遗传变异验证结节病基因特征

本研究对407例结节病患者进行了全基因组关联研究(GWAS) (Affymetrix 6.0 SNP array),其中包括212个AAs(包括68个合并病例)和195个EAs(包括46个合并病例),分析了结节病患者和健康人群中存在无偏性结节病特征基因的约1,300个常见SNP的等位基因频率控制(见补充文字S1详情)。在标称p值<0.01,30,从6个非偏见的20-基因签名基因中发现了30个SNP与结节病有关(表5),包括在AA和EA样本之间重叠的4个基因([头蛋白],RMB12B[RNA结合基序蛋白12b],SESN3(sestrin 3),TSHZ2.[茶衬衫锌指同源盒2])。AAs中最显著的签名基因SNP为rs629508 (P = 1.7×10)−3)SESN3,whereas in EA cases, the most significant SNP was rs2618134 (P = 4.7×10−5)RBM12B..有趣的是,几种SNP也与复杂的顺曲有显着相关,包括RS629508(P = 5.4×10−5) and rs1294689 (P = 3.6×10−5)和rs10485815 (P = 2.8×10 .−5),在EA样本(表5).相比之下,从宿〜3,800常见的SNPS驻留在TCR / JS / CCR签名基因中,37只SNP与AA样品中的rARAROIZIOS有关,而34 SNP分别在EA样品中显着(表S1).的most highly significant TCR-JS-CCR signature gene SNP in AAs was rs2131817 (P = 1.4×10−5)AKT3,而在EA案例中,最重要的SNP是RS7614488(P = 7.8×10−7)CBLB..几种TCR / JS / CCR签名基因SNP,RS2953040和RS6791765CBLB.(Cas-Br-M,鼠,生态逆转录病毒转化序列b)和rs2131817AKT3与EA和AA结节病病例(P <0.01)中的结节病有显着相关(P <0.01)(表S1).

缩略图
表5。在20个无偏性特征基因中,SNPs与结节病显著相关(P<0.01)。

https://doi.org/10.1371/journal.pone.0044818.t005

PubMatrix评价

医疗信息学工具PubMatrix(http://pubmatrix.grc.nia.nih.gov)工具随后用于评估已发表的生物医学文献(PubMed)中结节病特征基因的相关性。针对一系列与肺纤维化或结节病相关的术语搜索每个签名基因,包括:“结节病”、“结核”、“肉芽肿性疾病”、“超敏性肺炎”和“肺纤维化”。大多数20个基因的特征基因是这些术语高度新颖的(表6),只有2/20的基因被PubMed引用与这些术语相关(HBEGF,LOC100132356).31 TCR / JS / CCR-基因特征的基因,基因8/31在结节病与文献被援引CD28,IFNG,IL7R,AKT3,IL2RA,IL2RB,STAT4证明这些条款强大的关系(表S2).

缩略图
表6。PubMatrix搜索与结节病相关的20个基因签名的结果。

https://doi.org/10.1371/journal.pone.0044818.t006

讨论

这项工作的主要目的是确定潜在的通用和特定种族的基因标记,以作为结节病以及对复杂结节病的发展的存在和/或易感性的存在新的生物标志物。结节病的患者队列利用全基因组表达谱,不偏不倚的基因标记由20个常染色体基因,鉴定出区别结节病的情况下,从健康人,更重要的,差异化的患者从治疗单纯性结节结节复杂。的20-gene signature exhibited equivalent prediction accuracy to other sarcoidosis signatures containing a greater number of genes (such as 39-gene and 78-gene sarcoidosis signatures) with each signature superior in accuracy to signatures with fewer genes (e.g., the 10 gene signature) (图S1).这20个特征基因中的大多数的表达水平显示出非复杂结节病和复杂结节病之间的一种相加模型模式(图3.),即当签名基因是上调,患有复杂结节病的患者比无并发症的结节病表现出更高的表达水平。在结节病签名,20的19个基因进行单向(上调或下调)的既复杂又简单结节病。因此,20个基因的信号似乎不仅复杂结节病和健康对照,但关于结节病例(既复杂又简单)和健康对照之间的差异可能传达信息之间捕获的差异。

缩略图
图3。20个特征基因表达的箱图。

深灰色的点和线表示每个类别的表达式的几何平均值。HC:健康对照组;美国:无并发症结节病患者;CS:合并结节病的患者。轴:日志2转换表达式的值。

https://doi.org/10.1371/journal.pone.0044818.g003

TCR/JS/CCR信号通路基因编码的基因产物与结节病的发病机制有关[6],[26]这些特征基因在EA和AA合并结节病患者及健康对照的差异基因中富集。我们比较了TCR/JS/CCR信号通路基因标记在结节病病例分类中的应用与无偏性20基因标记的应用。在区分结节病病例和健康对照时,这两种特征都具有较高的预测准确性(>80%)。相比之下,20个基因标记对AA和EA合并合并结节病合并无合并结节病的预测准确率明显优于TCR/JS/CCR信号通路基因标记(81.4% vs. 58.8%, P<10)−15,t-检验)。我们推测,20种基因标记的公正性质允许的相比更严格TCR / JS / CCR信号通路信号基因复杂结节病的特点,更好地捕捉。的TCR / JS / CCR信号通路的基因在结节病的发展的潜在作用被这个签名的能力证实成功区分多数结节病和健康对照组。然而,我们推测,无论是结节病病情恶化或复杂的结节病的发展可能需要扩展超出了TCR / JS / CCR途径基因和途径的参与。这些研究结果强调了这种疾病的复杂病理生物学和牵连的全球和公正的方法的必要性。

我们进一步分别评估了EA和AA样本中20基因结节样特征的分类准确性,发现20基因特征在健康对照中对EA或AA结节病(复杂和不复杂)病例的分类准确率为85%。相比之下,20个基因的结节病特征区分复杂结节病和非复杂结节病的准确率在AA病例中为>80%,但在EA病例中仅为~ 60%,可能是复杂结节病样本量相对较小或更大的遗传变异导致的AA表达异常偏倚。需要进一步研究的问题。20基因标记和TCR/JS/ ccr -基因标记均能成功区分结节病病例和IPF患者,预测准确性相似,反映了免疫发病机制、临床病程、预后和对类固醇治疗的反应差异[29]在这两种肺纤维化疾病中。这一发现可能推断该标记作为结节病诊断生物标志物的额外临床应用价值。

如由搜索PubMed引文(PubMatrix结果)的缺乏,20基因签名是由结节病易感性和疾病的严重程度非常新颖的候选基因。作为补充方法来验证我们的发现[30]- - - - - -[35],我们检测了结节病病例和健康对照中20个无偏倚结节病特征单核苷酸多态性(SNPs)以及TCR/JS/CCR信号通路特征基因SNPs的等位基因频率,该等位基因是通过对400多个EA和AAs中的遗传变异进行全基因组评估构建的GWAS数据集结节病。由于SNPs和拷贝数变异(CNVs)等遗传变异对基因表达的变化有重要的贡献,SNPs被注释到这些特征基因的基因组区域(基于Affymetrix注释),因此,SNPs可能通过充当基因表达变化的角色独联体-eqtls。在我们的20个签名基因中的〜300个SNP中,我们鉴定了30个SNP(对应于6个签名基因),其在EA或AA样本中具有显着相关的rARADIOZ病症,这表明这些CIS作用SNP在调节结节病表达方面的潜在作用签名基因。类似地,来自TCR / JS / CCR签名基因中的〜3,800 SNP,观察到SNP和结节病之间的关系。虽然这些发现有用于验证签名基因的潜在重要性和相关性,但这些SNP与表达之间的直接关联是必要的,以验证这些关系。我们的结果表明遗传变体通过独联体式作用eQTLs可能有助于在结节病签名的基因的表达的变化。我们进一步认识到其他因素,如反式作用的eqtl、环境因素或表观遗传途径可能对特征基因表达变异有重要影响。涉及全基因组基因型数据的进一步调查(例如,作图)反式在相同样本上的表达数据可能会为遗传学对已识别基因签名的贡献提供更深入的见解。

结节病患者外周血中T细胞数量异常已被描述[36]显著淋巴细胞减少,包括CD4、CD8和CD19阳性细胞,常见于结节病患者,并与疾病严重程度相关[37].个体特征基因可能不仅在结节病的病理生理学中有作用,而且可能作为一种新的治疗靶点。例如,HBEGF是EGF家族生长因子的一员,是多种细胞类型包括成纤维细胞、平滑肌细胞和上皮细胞的有效有丝分裂原和趋化剂[38]- - - - - -[41].大量的证据表明HBGEF在伤口愈合和对损伤的反应中起作用[42]- - - - - -[45]导致猜测HBEGF可能代表了慢性肺结节病的病理生物学靶点和新的治疗靶点,PubMatrix搜索结果支持了这一观察结果。

在我们的20个基因特征中,LOC100132356被引用最多的文献考研,虽然它只是代码的假想蛋白。这个基因被链接到诸如结节病,结核,肉芽肿病,过敏性肺炎和肺纤维化。然而,该基因的具体功能目前还不清楚。

最近,我们比较了自限性结节病患者和进行性限制性纤维化患者的肺基因表达谱[46]在进展性肺结节病患者中,下调基因相对上调基因的数量更多。这些发现与我们的特征基因在复杂结节病患者中的表达谱高度一致。有趣的是,我们没有发现结节病特征基因与通过比较自限性和进行性肺结节病产生的差异表达基因之间的任何重叠。在我们的队列中,除了有严重肺部疾病的病例外,没有重叠可能反映了更严重的疾病,包括心脏和神经系统结节病。此外,我们的研究没有涉及肺组织表达,而是对PBMCs的分析,因此组织特异性表达也可能导致这种重叠的缺乏。

此外,我们的结节病基因签名在两个独立的验证队列中表现良好(UCSF和俄勒冈州)[27],[28].我们应该在验证中指出两个挑战。首先,我们的微阵列平台(Affymetrix人类外显子1.0 ST阵列)与验证队列(Affymetrix人类基因组U133加2.0阵列)不同。其次,我们的研究侧重于PBMC中的基因表达,而USCF队列分析了全血表达型材[27]

总而言之,尽管存在显著的限制,包括分析集中相对较小的EA复杂案例,在EA和AA结节病病例中,20个无偏倚的分子基因标记被确定为潜在的新型分子生物标志物,用于诊断结节病以及存在复杂结节病,具有相当的准确性。通过在重复结节病队列中的验证和对其他肉芽肿性疾病(如韦格纳氏病、超敏性肺炎和结核病)的测试,这种结节病的基因特征可能代表了一种新的复杂结节病的通用基因特征,并为这种神秘疾病的个体化治疗提供了一个跳板。

材料和方法

受试者和PBMC样本

本研究由伊利诺斯大学芝加哥分校(UIC)机构审查委员会(IRB)批准,并获得所有受试者的书面知情同意。UIC的IRB委员会成员(主席)包括:Indru Punwani, D.D.S, Susan Labott, Ph.D., Paul Heckerling, m.d., and Kathryn Rugen, ph .约翰霍普金斯大学研究人员提供的DNA样本,以及他们在本研究中的使用,都得到了约翰霍普金斯大学IRB的批准。从结节病患者(n = 39)和健康对照组(n = 35)采集PBMC样本(表1).结节病的诊断依据建立联合国际标准[47].排除其他并发全身炎症性疾病的受试者。本研究共纳入29例非洲裔美国人(AA)和10例欧洲裔美国人(EA)结节病患者,其中18例AA和4例EA患者诊断为复杂结节病,定义为心脏结节病(如室性心律失常)。[3],神经系统Sarcoid(例如,Hyperdense MRI病变的证据)[4]或严重肺结节病(FVC<50%)。每个病人治疗状况的详细描述已列于表S3

核糖核酸微阵列杂交

采用标准分子生物学方法(n = 74)从PBMCs中分离总RNA,无DNA污染或RNA降解。样品处理(如cDNA生成、片段化、末端标记、与Affymetrix基因芯片人类外显子1.0 ST阵列杂交)由芝加哥大学功能基因组学设施按照制造商的说明进行。

结节病和复杂结节病差异表达基因的鉴定

使用Affymetrix电动工具v.1.12.0(人外显子1.0 ST数组进行了总结http://www.affymetrix.com/)(见补充文字S1详情)。微阵列数据已上传到NCBI数据库GEO(GEO登录号:GSE37912)。除去对染色体X和Y的基因,以避免性别的潜在混杂因素。SAM(微阵列显着性分析)[48],在samrR统计包的库[49],用于比较日志2患者之间 - 转化的基因表达水平与在组合分别复杂结节病和正常对照(AA和EA),EA和AA样品。假发现率(FDR)是使用q值的方法来控制[50].倍变化大于1.4和q值小于0.05的转录本被认为是差异表达。我们搜索了丰富的京都基因和基因组百科全书(KEGG)[51]差异基因之间的生理途径相对于使用NIH / David设置的最终分析[52],[53].benjamin - horchberg术后校正p值<0.05[54]被用作截断点。

结节病及复杂结节病分类的基因标记鉴定

为了识别对结节病诊断和分类有用的基因特征,我们使用了一种基于线性核的支持向量机(SVM)的机器学习算法,结合递归特征消除(RFE)来生成预测模型(见补充)文字S1详情)[55]- - - - - -[58].的E1071.R统计包的库[49]进行SVM和RFE。在每一轮RFE中,SVM线性分类器由AA和EA的合并样本训练,包括所有健康对照和结节病患者。在随后的分析中使用了由具有显著峰值预测准确性的最小数量基因组成的基因标记。为了测试我们的基因标记的性能,我们使用SVM进行了1000次5倍交叉验证。此外,还分别在AA和EA样本中检测了基因标记的分类准确性。我们还使用了两个使用不同微阵列平台的独立结节病数据集[27],[28]以验证我们的基因签名。

支持信息

图S1。

分类精度在每个RFE步骤中的分布。x轴:每一步的基因数量;y轴:5倍交叉验证(重复1000次)的分类精度。红线表示每个RFE步骤的平均精度。

https://doi.org/10.1371/journal.pone.0044818.s001

(PDF)

图S2。

20个基因标记的分类精度分布。x轴:5倍交叉验证(重复1000次)的分类精度。虚线表示平均分类精度。(A) AA样本中所有结节病患者与健康对照;(B) AA样本中合并结节病患者与无合并结节病患者的对比;(C) EA样本中所有结节病患者与健康对照;(D) EA样本中合并结节病患者与非合并结节病患者的对比。

https://doi.org/10.1371/journal.pone.0044818.s002

(PDF)

图S3。

个体群体中20个基因签名与TCR/JS/CCR信号通路基因签名的比较精度的分布是基于1000倍5倍交叉验证。虚线表示20个基因签名或TCR/JS/CCR信号通路基因签名的平均分类精度。HC:健康对照组;美国:无并发症结节病患者;CS:合并结节病的患者。

https://doi.org/10.1371/journal.pone.0044818.s003

(PDF)

图S4。

20个基因标记和TCR/JS/CCR信号通路基因标记在结节病与IPF患者分离中的作用精度的分布是基于1000倍5倍交叉验证。虚线表示20个基因签名或TCR/JS/CCR信号通路基因签名的平均分类精度。

https://doi.org/10.1371/journal.pone.0044818.s004

(PDF)

表S1。

SNP明显与31 TCR / JS / CRR签名基因内的结节病相关(P <0.01)。

https://doi.org/10.1371/journal.pone.0044818.s005

(PDF)

表S2。

PubMatrix搜索针对结节病的TCR/JS/CCR签名基因相关搜索词。

https://doi.org/10.1371/journal.pone.0044818.s006

(PDF)

致谢

作者要感谢Steven M. Dudek博士和Jeffrey R. Jacobson博士进行了宝贵的讨论。作者还想感谢殷A高博士对图片的编辑。这项工作也受益于约翰霍普金斯结节病基因库/数据库和马里兰州消耗性医院(Eudowood)。

作者的贡献

构思并设计了实验:TZ WZ NJS DRM KSK IN RFM JGNG。进行了实验:TZ WZ SFM MW。分析数据:TZ WZ。贡献试剂/材料/分析工具:TZ WZ NJS ESC DRM KSK SFM MW IN。写的论文:TZ WZ RFM JGNG。

参考文献

  1. 1。Iannuzzi MC,Rybicki BA,Teirstein AS(2007)结节病。新英格兰医学杂志357:2153至2165年。
  2. 2。Newman LS, Rose CS, Maier LA(1997)结节病。医学336:1224-1234。
  3. 3.Nunes的H,Freynet O,Naggara N,Soussan男,温曼P,等人。(2010)心脏结节病。肖明和呼吸暴击护理医学杂志31:428-441。
  4. 4.Zajicek JP, Scolding NJ, Foster O, Rovaris M, Evanson J, et al.(1999)中枢神经系统结节病的诊断和治疗。Qjm 92: 103 - 117。
  5. 5。Morgenthau As,Iannuzzi MC(2011)结节病的最新进展。胸部139:174-182。
  6. 6。Iannuzzi MC,Rybicki BA(2007)结节病的遗传学:候选基因和基因组扫描。PROC上午胸志4:108-116。
  7. 7。布鲁尔顿DA科伯恩C,詹姆斯DC,詹姆斯DG,内维尔E(1977)结节病的HLA抗原。临床实验免疫学27:227-229。
  8. 8.Grunewald J,Eklund A,Olerup O(2004)人白细胞抗原I类等位基因和疾病患者疾病患者。am J Respir Crit Care Med 169:696-702。
  9. 9.Rossman MD, Thompson B, Frederick M, Maliarik M, Iannuzzi MC, et al. (2003) HLA-DRB1*1101:黑人和白人结节病的显著危险因素。Am J Hum Genet 73: 720-735。
  10. 10.mariarik MJ, Chen KM, Sheffer RG, rybickba, Major ML, et al.(2000)非裔美国人结节病的自然抗性相关巨噬细胞蛋白基因。美国呼吸细胞生物学杂志22期:672-675。
  11. 11.Hutyrova B, Pantelidis P, Drabek J, Zurkova M, Kolek V, et al.(2002)白细胞介素-1基因簇多态性在结节病和特发性肺纤维化中的作用。急救护理杂志165:148-151。
  12. 12.Akahoshi M, Ishihara M, Remus N, Uno K, Miyake K, et al. (2004) IFNA基因型与结节病发病风险的关系。Hum Genet 114: 503-509。
  13. 13。Kelly DM, Greene CM, Meachery G, O’mahony M, Gallagher PM,等(2005)内毒素上调白细胞介素-18:在结节病中革兰氏阴性定殖的潜在作用。急救护理杂志172:1299-1307。
  14. 14。Bombieri C,Luisetti男,Belpinati楼Zuliani E,贝雷塔A,等人。(2000)中增加CFTR结节病基因突变的频率:一个病例/对照关联研究。EURĴ人类遗传学8:717-720。
  15. 15.Schurmann M,Albrecht M,Schwinger e,Stuhrmann M(2002)综合症中的CFTR基因突变。EUR J HUM Genet 10:729-732。
  16. 16。Kruit A, Grutters JC, Ruven HJ, van Moorsel CH, Weiskirchen R, et al.(2006)结节病伴和无纤维化患者转化生长因子- β基因多态性。胸部129:1584 - 1591。
  17. 17。Pabst S, Baumgarten G, Stremmel A, Lennarz M, Knufermann P, et al. (2006) toll样受体(TLR) 4多态性与结节病的慢性病程相关。临床实验免疫143:420-426。
  18. 18.McGrath DS,Foley PJ,Petrek M,Izakovicova-Holla L,Kolek V等人。(2001)ACE基因I / D多态性和顺性肺病严重程度。AM JRECIR CRIT护理MED 164:197-201。
  19. 19.Furuya K,Yamaguchi E,Itoh A,Hizawa N,Ohnuma N等人。(1996)将血管紧张素I转化为酶(ACE)基因的多态性作为结节病的遗传危险因素。胸部51:777-780。
  20. 20.Arbustini E, Grasso M, Leo G, Tinelli C, Fasani R, et al.(1996)结节病中血管紧张素转换酶基因多态性。急救护理杂志153:851-854。
  21. 21.Valentonyte R, Hampe J, Croucher PJ, Muller-Quernheim J, Schwinger E, et al. (2005) C-C趋化因子受体2等位基因在结节病中的研究,重点是基于家族的分析。急救护理杂志171:1136-1141。
  22. 22.Spagnolo P, Renzoni EA, Wells AU, Sato H, Grutters JC, et al. (2003) C-C趋化因子受体2与结节病:与Lofgren综合征的关联。急救护理杂志168:1162-1166。
  23. 23。诸桥K,高田T,大森K,铃木E,Gejyo的F日本结节病患者(2003)血管内皮生长因子基因多态性。胸围123:1520年至1526年。
  24. 24。Schurmann M, Reichel P, Muller-Myhsok B, Schlaak M, Muller-Quernheim J, et al.(2001)全基因组搜索结节病易感基因的结果。急性呼吸危重症护理杂志164:840-846。
  25. 25。华透明r,hampe j,huse k,rosenstiel p,albrecht m等。(2005)结节病与BTNL2中截断的剪接位点突变有关。NAT Genet 37:357-364。
  26. 26。Grunewald J, Eklund A (2007) CD4+ T细胞在结节病中的作用。Proc Am Thorac Soc 4: 461-464。
  27. 27。KOTH LL,索伯格OD,彭JC,巴克塔NR,阮CP等。(2011年),结节病血转录反映肺部炎症和重叠肺结核。牛J和呼吸暴击护理医学184:1153年至1163年。
  28. 28。Sharma SM, Choi D, Planck SR, Harrington CA, Austin CR, et al.(2009)基于基因表达谱的中轴性脊椎关节病发病机制研究。关节炎研究11:R168。
  29. 29。Antoniou KM, Tzouvelekis A, Alexandrakis MG, Sfiridaki K, Tsiligianni I, et al.(2006)肺结节病和特发性肺纤维化的不同血管生成活性。胸部130:982 - 988。
  30. 30.段胜,黄荣生,张伟,Bleibel WK, Roe CA,等(2008)人类转录水平变异的遗传结构。Am J Hum Genet 82: 1101-1113。
  31. 31.莫利男,莫洛尼CM,韦伯TM,德夫林JL,Ewens KG。,等人。(2004)在人基因表达的全基因组变异的遗传分析。自然430:743-747。
  32. 32.Stranger BE, Forrest MS, Dunning M, Ingle CE, Beazley C,等(2007)核苷酸和拷贝数变异对基因表达表型的相对影响。科学315:848 - 853。
  33. 33.陌生人BE,NICA AC,福雷斯特MS,迪马斯A,鸟CP,等。人基因表达的(2007)基因组学的人口。纳特遗传学39:1217年至1224年。
  34. 34.斯皮尔曼RS,Bastone LA,伯迪克JT,莫利男,Ewens WJ,等人。(2007)常见基因变异占族群之间的基因表达差异。纳特遗传学39:226-231。
  35. 35。张伟,段胜,Kistner EO, Bleibel WK, Huang RS, et al.(2008)群体间基因表达差异的遗传变异评估。Am J Hum Genet 82: 631-640。
  36. 36。Kataria YP,Lobuglio AF,Bromberg Pa,Wurtubise PE(1976)肌肉淋巴细胞:B和T细胞定量。ANN N Y ACAD SCI 278:69-79。
  37. 37。Sweiss NJ,萨卢姆R,甘地S,港ML,Sawaqed R,等人。(2010)显着CD4,CD8,CD19和淋巴细胞减少在患有严重的疾病表现结节病相关因素的患者的外周血中。公共科学图书馆一5:e9088。
  38. 38。一种巨噬细胞来源的肝素结合生长因子的分离和鉴定。细胞规则1:811-819。
  39. 39。Higashiyama S, Abraham JA, Klagsbrun M(1993)肝素结合egf样生长因子刺激平滑肌细胞迁移:与细胞表面硫酸肝素相互作用的依赖性。J Cell Biol 122: 933-940。
  40. 40.(1)表皮生长因子、肝细胞生长因子和角化细胞生长因子对人角膜上皮细胞增殖、运动和分化的影响。Exp Eye Res 59: 665-678。
  41. 41.Kiso S, Kawata S, Tamura S, Higashiyama S, Ito N, et al.(1995)肝素结合表皮生长因子样生长因子作为肝营养因子在部分肝切除术后大鼠肝脏再生中的作用。肝脏病学22:1584 - 1590。
  42. 42.Marikovsky M, Breuing K, Liu PY, Eriksson E, Higashiyama S, et al.(1993)创伤液中肝素结合egf样生长因子对损伤的反应。美国国家科学学院学报90:3889-3893。
  43. 43.McCarthy DW, Downing MT, Brigstock DR, Luquette MH, Brown KD, et al.(1996)儿童患者热损伤部位肝素结合表皮生长因子样生长因子(HB-EGF)的产生。J Invest Dermatol 106: 49-56。
  44. 44.Ito N, Kawata S, Tamura S, Kiso S, Tsushima H, et al.(1994)肝素结合egf样生长因子是一种有效的大鼠肝细胞有丝分裂原。生物化学与生物物理学报198:25-31。
  45. 45.本间T,酒井男,程HF,安田T,科菲RJ JR等人。(1995年)在急性损伤后大鼠肾脏肝素结合表皮生长因子样生长因子mRNA的诱导。临床研究杂志96:1018至1025年。
  46. 46.Lockstone HE, Sanderson S, Kulakova N, Baban D, Leonard A, et .(2010)肺样本基因集分析为进展性纤维化肺结节病的发病机制提供了线索。美国呼吸危重症护理杂志181:1367-1375。
  47. 47。无作者名单(1999)结节病声明。美国胸科学会(ATS)、欧洲呼吸学会(ERS)和世界结节病和其他肉芽肿性疾病协会(WASOG)联合声明,由ATS董事会和188bet官网地址ERS执行委员会于1999年2月通过。急救护理杂志160:736-755。
  48. 48。acta photonica sinica, 2011, 37 (3): 361 - 368 . acta photonica sinica, 2011, 37(3): 361 - 368。中国科学院院刊98:516 - 5121。
  49. 49。r_development_core_team(2005)r:统计计算的语言和环境。维也纳,奥地利:统计计算的基础。
  50. 50.Tibshirani R, Hastie T, Narasimhan B, Chu G(2002)通过缩小的基因表达中心诊断多种癌症类型。美国国立科学学院学报99:6567-6572。
  51. 51.Kanehisa男,转到S,川岛S,奥野Y,服部M(2004)破译基因组的KEGG资源。核酸研究32:D277-280。
  52. 52.Huang da W,Sherman Bt,Lempicki Ra(2009)使用David Bioinformatics资源的大基因清单系统和一般性分析。NAT PROTOC 4:44-57。
  53. 53.(2003)基于标注、可视化和集成发现的数据库。基因组生物学4:P3。
  54. 54.Benjamini Y, Hochberg Y(1995)控制错误发现率:一种实用而强大的多重检测方法。J R Statist Soc B 57: 289-300。
  55. 55.Vapnik V(1998)统计学习理论。纽约:约翰·威利父子公司。
  56. 56.guy I, Weston J, Barnhill S(2002)支持向量机用于癌症分类的基因选择。机器学习46:389-422。
  57. 57.Thuerigen O, Schneeweiss A, Toedt G, Warnat P, Hahn M,等(2006)预测吉西他滨、表柔比星和多西紫杉醇在原发性乳腺癌中的病理完全缓解的基因表达特征。美国临床医学杂志24期:1839-1845。
  58. 58.张旭,陆旭,石强,徐新强,梁慧琴,等。(2006)质谱和微阵列数据的递归SVM特征选择和样本分类。BMC生物信息学7:197。