摘要
模块化和荟萃分析鉴定了TB患者的常见转录响应相对健康对照组http://our.ly/yvep7.
到编辑:
结核分枝杆菌估计是感染了世界三分之一的人口,并继续成为死亡率和发病率的重大原因[1].需要新的和改进的诊断或治疗监测工具,血液基mRNA诊断是潜在的解决方案[2].人血的基因表达微阵列分析已被广泛用于在活性结核病(TB)中的宿主转录反应鉴定潜在的生物标志物,更好地理解宿主免疫反应[2].到目前为止,从已发表的研究中确定的实际基因相对缺乏一致性[2那3.]但虽然有一些途径达成一致。干扰素(IFN)信号传导已被识别为许多个人研究中的主要签名[2那4.];然而,当显着的基因清单从八个公开的TB数据集组合时,TRM1(在骨髓细胞1的触发受体1)信号传导变成最重要的途径[5.].
我们使用不同的方法统称公开可用的数据集以识别可以区分从控制的鲁棒性差异表达的基因。这些基因是积极疾病的血基mRNA生物标志物的潜在候选者,可以提供关于TB发病机制下面的免疫和炎症反应的有价值的信息。
我们对PubMed和MicroArray存储库进行了全面搜索。具有活跃的TB患者的公开数据集相对鉴定并保留了健康的对照,潜在感染或患者治疗后。后三个队列在群体级别转入同义[4.那6.那7.].艾滋病毒感染的个体被排除在此分析之外。
在可能的情况下,数据以原始格式导入,Illumina和Agilent数据为75分位数标准化,Affymetrix数据为RMA(鲁棒多芯片平均)分位数标准化。如果没有原始数据,则使用作者的标准化。然后过滤所有数据集的低表达转录本(保留≥10%的样本中表达变化为中值2倍的转录本),然后进行统计过滤(独立t检验与Benjamini-Hochberg多重检验校正q值<0.05)。每个数据集的探针/转录本id与Entrez基因标识符匹配。筛选多个代表基因,保留最显著的(按q值)。维恩映射(8.用于检查任何两个数据集之间的重叠的重要性。Meta-Profiling [9.[是否进行了重要的基因列表以确定包含在元签名中所需的重叠次数。只保留以至少确定的重叠数量的一致调节方向表达的那些基因被保留为元签名。
模块化分析[10.]是兼容的数据集;由于工具不支持其技术平台,该方法无法分析GSE56153,GSE34608和GSE28623。通过使用IPA(Indenuey途径分析;聪明的系统,Qiagen,Redwood City,CA,USA)产生规范途径,基因网络分析,基因函数注释和上游分析。
meta分析共纳入16个数据集(GSE39939、GSE39940、GSE54992、GSE37250、GSE31348、GSE36238、GSE42825、GSE42826、GSE42830、GSE40553、GSE56153、GSE34608、GSE28623、GSE19444、GSE19442和GSE19439)。这些数据集的模块化分析揭示了相似之处,过度表达的模块标注为细胞毒性、IFN、炎症和树突状细胞/凋亡,而低表达的模块标注为b细胞、t细胞、淋巴细胞激活和线粒体应激(图1A).两个具有最小队列大小的数据集(GSE54992和GSE36238)具有不同的模块化图案,模块较少,模块与对照组显着不同。
对于每个数据集独立地,鉴定了对照和TB组之间的差异表达基因。在数据集中的差异表达基因列出之间存在显着重叠,无差异在依赖于对照组的选择(图1B.).荟萃分析鉴定了380个基因,其在九个或更多个数据集中在一致的调节方向(图1C.).在数据集上,上调基因比下调基因的识别更一致(图1D).在所有16个数据集中鉴定了5个基因:AIM2那BATF2.那Fcgr1b.那生命值和TLR5。
IFN-γ是这380个meta-signature基因中预测最高的上游调控因子,IPA数据库中有54个基因直接或间接与IFN-γ相关(数据未显示)。380基因元标记富集了IPA典型通路,涉及模式识别、IFN信号、白细胞介素-6信号、TREM1信号和补体(数据未显示)。基于这些发现,我们制作了一幅漫画,概括了基因的主要功能群及其相互关系(图1E.).
在这项研究中,我们与健康对照、治疗后患者和无症状潜伏感染者相比,发现了一种活动性结核病的380基因元标记,显示了先天和适应性免疫功能的富集。
使用两种主要方法来分析公开的数据:模块化分析和元分析。模块化分析取决于鉴定协调表达基因组(模块)的差异而不是单个基因的差异[10.].我们在数据集之间识别出具有显着的相似性,具有使用IFN,炎症功能,单核细胞和中性粒细胞功能的模块的过表达,以及B和T细胞模块的曝光表达。这些发现与包括分组模块化分析的个体研究保持一致[4.那7.].其中分组的模块化型材不一致,这可能是由使用的小群组尺寸产生的,并强调需要适当供电的个体研究以检测所有差异表达的基因。
使用荟萃分析,我们发现380个基因一致地在九个或更多个数据集中差异表达,其中五个基因鉴定为在所有16个数据集中差异表达。这五种基因是AIM2那BATF2.那Fcgr1b.那TLR5和生命值已被证明可能发挥作用结核分枝杆菌感染 [11.-14.].一个角色TLR5尚未描述且鉴定这种差异调节的基因可以是程序响应的一部分,而不是特异性靶向对病原体定制的反应。
将包含Meta-α的380个基因鉴定为IFN-γ作为最显着的潜在上游调节分子,具有大网络IFN-γ调节基因存在于380个基因内。IFN-γ对人体中的分枝杆菌病是至关重要的,在IFN-γ受体或Stat1(信号传感器和转录激活剂1)中具有突变,导致易感性增加[15.].然而,还观察到在I IFN信号传导下游的基因表达分子的上调,这与Tb加剧相关,因为I型IFN已被证明在IFN-γ的下游拮抗信号传导[15.].因此,捕获显着富集的整体情况可能比识别一个单独的途径更具信息,如摘要卡通(图1E.).在元信号中,包括多种模式识别受体、细胞因子、炎性小体、补体和免疫球蛋白在内的许多免疫通路/功能都得到了丰富。这支持了从小鼠和人类研究中获得的不同发现,即免疫反应随后结核分枝杆菌感染是复杂的,可以是跨监管的[15.].
本研究证实了血基转录分析的再现性,以确定结核病中的先天和适应性宿主响应。它还识别出更可靠地确定上调的mRNA转录物,并突出了几种可以共同用作活性疾病的潜在生物标志物的mRNA候选者。这些发现对MRNA表达工具的设计和实现有影响,以支持TB的诊断和治疗监测。
脚注
支持声明:S.BANDLEY和A. O'GARRA由英国医学研究委员会(MRC)提供支持(授予U117565642),现在是Francis Crick(A. O'Garra:Crick预算10126)。根据英国MRC和英国MRC和英国部门为国际发展(DFID)共同资助的,根据MRC / DFID协议协议(授予MR / J010723 / 1)。G. Santis部分由健康部门提供支持通过国家卫生研究院研究中心综合生物医学研究中心颁发的纽约州和圣托马斯国家卫生基金会信托与国王伦敦合作。资助者在研究设计,数据收集和分析中没有作用,决定发布或准备稿件。本文的资助信息已存入FundRef。
利益冲突:可以在本文的在线版本旁找到披露www.qdcxjkg.com
- 已收到2015年9月20日。
- 公认2016年2月10日。
- 版权所有©2016