广告
  • 加载指标

全基因组测序基因分型结果与传统的调查结核分枝杆菌爆发:一个纵向的分子流行病学研究

  • Andreas Roetzer,

    贡献同样处理:Andreas Roetzer,罗兰一昼夜的托马斯·a·科尔

    联系分子Mycobacteriology Forschungszentrum Borstel Borstel,德国

  • 罗兰一昼夜的,

    贡献同样处理:Andreas Roetzer,罗兰一昼夜的托马斯·a·科尔

    联系石勒苏益格-荷尔斯泰因州大学医院流行病学研究所,德国基尔

  • 托马斯·a·科尔,

    贡献同样处理:Andreas Roetzer,罗兰一昼夜的托马斯·a·科尔

    从属关系分子Mycobacteriology Forschungszentrum Borstel Borstel,德国,基因组研究和系统生物学研究所CeBiTec,比勒费尔德大学,德国比勒费尔德

  • 基督教Ruckert

    联系基因组研究所和系统生物学、CeBiTec、比勒费尔德大学,德国比勒费尔德

  • 乌尔里希Nubel,

    联系德国Wernigerode罗伯特·科赫研究所

  • 约亨•布鲁姆

    联系比勒费尔德大学计算基因组学,CeBiTec德国比勒费尔德

  • 蒂埃里-沃斯

    联系分类学和进化,国家d国立博物馆,高等实用des高级练习曲,巴黎,法国

  • Sebastian Jaenicke

    联系比勒费尔德大学计算基因组学,CeBiTec德国比勒费尔德

  • Sieglinde Schuback,

    联系Gesundheitsamt des克瑞斯Steinburg Itzehoe,德国

  • Sabine Rusch-Gerdes,

    联系国家参考中心分枝杆菌,Forschungszentrum Borstel, Borstel,德国

  • 菲利普•供应

    联系由U1019 CNRS UMR 8204年,巴斯德研究所德里尔大学法国里尔北部,法国里尔

  • 家Kalinowski,

    联系基因组研究所和系统生物学、CeBiTec、比勒费尔德大学,德国比勒费尔德

  • Stefan Niemann

    sniemann@fz-borstel.de

    联系分子Mycobacteriology Forschungszentrum Borstel Borstel,德国

文摘

背景

理解结核分枝杆菌(Mtb)传播指导有效的结核病控制策略至关重要。传统的应变类型缺乏足够的歧视性的力量来解决大暴发。这里,我们测试使用新一代基因组测序的潜力霍乱传播链数占与霍乱疫情相关的识别。

方法和结果

在长期(1997年至2010年)潜在人群为基础的分子流行病学监测包括共有2301名患者,我们发现了一个大爆发哈勒姆血统的结核分枝杆菌造成的压力。全基因组测序的主要性能测量结果(WGS)分析是WGS的程度的相关性分析和接触者追踪数据和爆发的时空分布情况。WGS 86隔离分析显示85个单核苷酸多态性(SNP),爆发细分为七个基因组集群(两个24隔离),加上36独特的SNP概要文件。WGS结果表明,首次发现于1997年爆发隔离被古典基因分型错误的集群。1998年,一个克隆(称为“汉堡克隆”)开始扩大,独立于社会环境的差异显然早期病例。Genome-based集群模式更好的按照接触者追踪数据和地理分布的情况下比基于经典的基因聚类模式。最多三个单核苷酸多态性被确定在八证实人际传播链,包括31个病人。我们估计结核分枝杆菌的基因组进化速率0.4每年每基因组突变。这个比率表明,Mtb生长在其自然宿主的倍增时间约22 h(每年400代)。发现,基于基因组变异的出现汉堡克隆是追溯到1993年和1997年之间的时期,因此之前不久发现疫情的流行病学监测。

结论

我们的研究表明,WGS优于常规病原体结核分枝杆菌多用于跟踪和调查micro-epidemics。WGS提供了结核分枝杆菌的基因组进化在其自然宿主环境随着时间的推移。

请参阅本文后面的编辑的总结

编者总结

背景

结核病归入传染性细菌疾病,通常感染肺部的一个主要公共卫生问题,尤其是在低收入和中等收入国家。在2011年,估计有870万人开发结核病在全球范围内,140万人死于这种疾病。肺结核是仅次于艾滋病毒/艾滋病而言,全球死于传染病。结核分枝杆菌导致结核病的细菌,容易在空气中的飞沫传播活动性疾病患者咳嗽或打喷嚏。肺结核的症状特征包括持续的咳嗽,体重下降,发热,盗汗。疾病包括痰涂片分析诊断测试(检查肺部的黏液咳出的存在结核分枝杆菌)、分枝杆菌培养(增长的结核分枝杆菌从痰),胸部x光检查。肺结核可以治愈每日服用一些抗生素至少六个月,尽管最近出现的耐多药结核分枝杆菌使结核病难以治疗。

为什么这样做研究?

尽管努力减少全球结核病负担的一些改进,每年开发结核病的人数继续下降是缓慢的。开发优化控制策略,专家需要能够准确地跟踪结核分枝杆菌在人类传播。因为结核分枝杆菌像所有细菌,积累基因变化随着时间的推移,有很多不同的菌株的遗传变异结核分枝杆菌。基因分型方法已经开发了可以识别不同的菌株通过检查细菌基因组的特定区域(蓝图),但由于这些方法检查只有一小部分基因,他们可能不区分相关传输链。即传统的菌株基因分型方法可能无法准确地确定一个肺结核疫情开始或通过人口如何传播。纵向队列研究中,研究者比较全基因组测序的能力(WGS),迅速成为广泛使用,传统的基因分型提供最近的德国结核病疫情信息。在纵向队列研究中,人口是随着时间的推移来分析一个特定的疾病的发生。

研究人员做了什么,发现了什么?

在长期(1997 - 2010)以人群为基础的分子流行病学监测(疾病监测,利用分子技术而不是疾病的报道)在汉堡和石勒苏益格-荷尔斯泰因州,研究人员发现了一个大的结核病疫情造成的结核分枝杆菌使用经典应变输入隔离的哈勒姆血统。研究人员检查了每一个使用WGS 86隔离从此次疫情和古典基因分型和被问及这两种方法的结果与接触者追踪数据(信息定期收集关于结核病患者最近的人,这样可以检测这些联系人治疗结核病和如有必要)和爆发的时空分布情况。WGS 85隔离标识单核苷酸多态性(SNPs;基因序列变异单构件,或核苷酸爆发改变),细分为七个集群的隔离和36独特的隔离。WGS结果表明第一隔离的疫情是由古典基因分型错误群集和拉紧”汉堡克隆”在1998年开始扩大。genome-based集群模式值得注意的是,在更好的根据数据和接触者追踪的地理分布情况下比基于经典的基因聚类模式,和他们确定了八个人际传播链证实,病人和31日最多三个单核苷酸多态性。最后,研究人员用他们的WGS结果来估计的汉堡克隆出现在1993年至1997年之间,前不久通过流行病学监测结核病疫情的发现。

这些发现是什么意思?

这些发现表明WGS可以用来识别特定菌株在大型结核病疫情比古典基因分型结果更准确。他们还提供新的演化的信息结核分枝杆菌在暴发和指示应如何解释WGS数据在未来genome-based分子流行病学研究。WGS有潜力提高结核病的分子流行病学监测和控制和其他传染病。重要的是,注意研究人员,持续降低成本的WGS,可用性的增加“板凳”基因组测序和生物信息学的发展都应该加快实施WGS作为标准方法识别传染病疫情的传播链。

额外的信息

请访问这些网站通过这个总结的在线版本http://dx.doi.org/10.1371/journal.pmed.1001387

介绍

传染病的死亡率仍然是一个重大的负担,尤其是在低收入和中等收入国家。在一个日益全球化的世界,人类倾向于自由流动的连续等人类病原体的传播结核分枝杆菌(Mtb),它仍然是最具破坏性的病原体之一[1],[2]。检测这种传播,了解疾病的动态,优化和开发结核病(TB)控制策略,准确跟踪病原体传播的外部主机人口的重要性[3]。为此,已经建立了各种应变输入方法和分子流行病学研究中使用。

关于百慕大,最常使用三种可靠的输入方法:6110年RFLP(限制片段长度多态性)[4]spoligotyping(空隙回文重复;CRISPRs)[5]和MIRU-VNTR(分枝杆菌点缀重复unit-variable串联重复序列的数量)打字[6]24个位点。这些方法已经成功地应用于各种研究问题,例如,调查实验室交叉污染、疫情调查,以人口为基础的分析,最近在大都市设置或遍及全国的传播[7]- - - - - -[9]。我们利用基因分型研究结核分枝杆菌的流行病学纵向以人群为基础的研究在汉堡和周边国家石勒苏益格-荷尔斯泰因州的城邦[8],[10],[11]。然而,尽管是6110年实际传播动力学的DNA指纹图谱显示有趣的方面,我们发现,只有大约50%的结果簇可以通过接触者追踪记录传输确认链接([8]未公开的数据)。几个原因可以解释,在短暂的接触可能会传播或高危人群(如人口无家可归或酒精),导致流行病学联系的情况下是很难建立基于病人的采访。

此外,尽管这些打字技术目标尤其是多态基因目标,他们询问不到1%的基因组,因此本质上限制歧视性的权力。因此,他们不能最优检测并解决最近的传播链[12],[13]。这种限制可以克服下一代应用程序的全基因组测序(WGS) genome-based流行病学[14]。WGS可以提供全面的遗传信息包括所有可能的基因目标、耐药性以及额外的有价值的信息,致病因素和基因组进化。持续技术发展迅速降低成本,WGS有潜力成为诊断和病原体的终极工具打字,并显著增强分子诊断在临床微生物学的影响[15]。尽管WGS-based Mtb的潜在的基因已经开始探索[12],[13],[16]准确地跟踪特定的爆发潜力,其精确克隆仍然是未定义的。

来解决这个问题,我们评估WGS-based跟踪连续多用于结核分枝杆菌的传播在都市环境中,和精确校准结核分枝杆菌的基因组的短期进化遵循其克隆扩张超过十年。首次检测到的应变在纵向的分子流行病学研究,我们在1997年开始在汉堡[10]。初步分析显示,2004年菌株主要是在当地一家酒吧和相关的高危人群,如酒精和无家可归的人[10]。值得注意的是,与其他相关疫情从这家喝到那家,没有超级撒布机识别来源病例。相反,它是酒吧环境高周转率偶尔游客(包括无家可归的人从邻近的旅馆),支持连续,酒精个人长期应变的传播没有艾滋病毒合并感染的影响。虽然汉堡公共卫生办公室做出了相当大的努力来解决疫情和酒吧在2006年关闭,压力在汉堡和石勒苏益格-荷尔斯泰因州继续扩散,最终导致86年传输到2010年底。

在这项研究中,我们进行的WGS 86隔离揭示集群应变传播的模式由传统的基因分型。我们测试是否WGS-based类型将提供一个更高的分辨率比传统类型的爆发,并更好的适应其时空分布和可用的接触者追踪数据。也被用来测量获得的数据的结核分枝杆菌基因组的变化水平明确的传播链,作为校准的关键参数WGS未来genome-based分子流行病学数据。

方法

研究人群

长期潜在人群为基础的分子流行病学监测在汉堡和石勒苏益格-荷尔斯泰因州自1月1日,1997年和2006年1月1日。所有culture-confirmed结核病患者,仅报道德国感染保护法案的基础上汉堡的公共卫生部门和石勒苏益格-荷尔斯泰因州的地区地区公共卫生部门,前瞻性的研究,直到12月31日,2010年。总的来说,隔离患者从2301年受到古典应变类型在此期间。其中,86属于集群的最大应变识别包含在这个调查。

分子流行病学研究是嵌入在强制执行的常规监测和联系调查工作公共卫生办公室根据法律授权的德国感染保护法案。他们批准的汉堡和石勒苏益格-荷尔斯泰因州为数据保护专员。

实验数据集

前瞻性地收集了案例数据通过训练有素的公共卫生人员使用一个标准化的问卷。以下信息通过病人得到面试:病人的性别、出生日期和国家、国籍,移民身份(如果适用),数年的住宅在汉堡(德国)、当前地址(或病人是否无家可归),病人是否生活在一个医疗保健或任何公共机构,教育水平和/或专业培训(至于这可以确定),病人的当前就业的本质(如果有的话),任何先前已知的接触他人的细节与结核病(特别是在6个月前第一次出现症状),和病人的家庭接触者的名字和/或任何职业密切接触者或拥挤的设置。

获得临床资料,也包括在问卷如下:第一次发病日期(如果可能,最近疑似暴露日期之间的时间间隔,出现症状,如果可用,之间的时间间隔的第一接触者追踪和出现症状),症状,诊断的日期和原因调查,延迟由于病人的延迟寻求医疗帮助,第一次约会的病例报告公共卫生办公室,有关医疗问题(尤其是艾滋病毒感染),结核菌素皮肤试验的结果(或干扰素释放试验),胸部影像学和微生物分析的结果,存在酗酒(定义为一个不适应的模式通过会议三个或更多的标准世界卫生组织icd - 10分类在任何时候在同一个12-mo时期)。社会人口和临床数据的每个索引从标准化病人问卷调查获得的人在第一次面试后立即重新集群的interview-independently研究之前,病人的隔离受到RFLP fingerprinting-in以确定病人的流行病学背景,特别是他/她可能加入一个高危组。此概要旨在帮助明确感染的途径和建立病人的联系信息是否足够,是否进一步Mtb感染可能是传播但仍未被发现的遗漏可能接触的人。当病人被认为是一个集群成员,额外的采访进行了如果可能,即。,如果一个或多个患者同一集群的诊断之前还活着,与已知的住所。

统计分析

分类数据比较的皮尔森χ-squared测试(或确切概率法,当预期的细胞大小小于5)。Wilcoxon等级和测试被用来确定两组之间的连续变量的分布不同;小动物——一张长有p值< 0.05为显著。

基因分型

从分枝杆菌菌株提取基因组DNA, DNA指纹分析使用6110年作为探针,spoligotyping 24-locus MIRU-VNTR基因分型是由标准化的协议,如前所述[4]- - - - - -[6]。总的来说,只有三个分离株(另一个乐队)略有不同6110年指纹模式。MIRU-VNTR输入显示只有少数差异,single-locus组成的变化,识别隔离成一个大的(n= 75)和四个小(n= 11)组(图S1)。

基因组测序

孤立的结核分枝杆菌的基因组DNA测序菌株7199/99使用454焦磷酸测序标准和paired-end运行。组装与GS新创汇编软件产生了124年五叠连群支架。差距关闭是通过PCR,扩增子的桑格测序。封闭的基因组测序错误纠正使用读取生成的Illumina公司平台,和精制序列自动使用注释系统GenDB注释[17]和H37Rv参考基因组(基因库ID: NC_000962.2)[18]。所有检测到的差异从H37Rv手工注释是策划。基因组是提交给ENA EMBL-Bank(加入HE663067数量)。

全基因组比对

结核分枝杆菌全基因组排列的菌株,我们采用淡紫色[19]与默认设置使用进步的淡紫色的算法。

重新排序

孤立的个人基因组DNA测序菌株的Illumina公司平台。结果读取被映射到Mtb H37Rv基因组(基因库ID: NC_000962.2)使用准确的校准程序萨鲁曼[20]。基因组覆盖率由至少一个阅读范围从92.7%到99.9%(意思是:96.4%),隔离7199/99的覆盖率为99.2%。单核苷酸多态性(SNPs)提取映射读取通过定制的Perl脚本使用最小覆盖十读取和80%的最小等位基因频率作为检测阈值。我们筛查snp在至少一个但不是所有临床分离株(即。爆发,变异识别隔离)。基因组测序质量下降的地区特色高GC含量或重复的元素会导致假阳性检测的多态性。因此,15预测snp基因如重复区域的PPE, PE_PGRS, ESX基因家族,与等位基因频率或选择覆盖率高于或低于阈值,测试作为控制和被发现是假阳性的PCR测序片段。

计算的进化率

进化率和分化时间计算的基础上,对准3663090测序从每个86碱基对Mtb隔离使用野兽软件[21]。序列是约会日期的基础上隔离Mtb隔离。我们使用了HKY核苷酸替换模型和一个严格的时钟模型。严格的时钟是合理的,因为一个没有显示的似然比检验的可能性值之间统计上的显著差异最大似然树计算利用PAUP时钟有或没有一个严格的执行[22]。野兽跑了108迭代后老化的106迭代。使用替代树先验(即。,prior probability distributions) in the Bayesian analysis resulted in very similar mutation rates and divergence times. In contrast, when analyses were run on an empty alignment to sample from the prior distribution, divergence times were strongly inflated, suggesting that our results were not an artifact reflecting the priors. Linear regression of root-to-tip distances from a maximum-likelihood tree against dates of isolation was performed by using Path-O-Gen software (available athttp://tree.bio.ed.ac.uk/software/pathogen/)。

计算人口的生殖健康

相关生殖健康Mtb血统的人类人口估计通过计算选择系数的最小二乘线性回归的斜坡病例数在每个血统通过时间。两个血统的斜坡的比率(αA /αB)提供了相对健康。选择系数估计(山坡)使用学生的比较t以及和明显不同(p< 0.05)。

结果

汉堡在城邦以人群为基础的流行病学研究涉及大约2000名患者进行了超过14 y,我们确定了异常引起的大型集群应变的哈勒姆家族通过使用经典应变打字,最初是基于6110年DNA指纹图谱,后来证实了24-locus MIRU-VNTR打字(见方法和图S1)。这个集群还包括病例石勒苏益格-荷尔斯泰因州的邻近的联邦国家,共有86名患者。详细描述的第一个集群38例观察2004发表之前[10]。所有86名患者的特点所示表1。70(81.4%)的男性和86例由16名女性与药物敏感结核病。只有19个外国出生;剩下的(77.9%)出生在德国,拥有德国国籍。

缩略图
表1。社会人口和86名患者的疾病特征研究集群。

https://doi.org/10.1371/journal.pmed.1001387.t001

古典输入数据不与空间分布情况和接触者追踪数据,显示多个源的参与情况。这些情况似乎是几个独立的传动链的一部分,没有区分6110年打字或24-locus MIRU-VNTR输入(图S1)[10]。因此,我们评估是否WGS-based允许更好的解决这个集群和pcr分析流行病学数据的相关性。

在WGS数据的分析,单核苷酸多态性和小删除细分86集群分离株的53%。总的来说,我们发现85个snp个人爆发之间的隔离,这都是由Sanger测序验证(表S1)。这验证了严格的阈值我们选择多态性频率和基因组覆盖率排除假阳性(见方法)。七个snp识别外的编码序列。剩余的78多态性可分为47个非同义和31同义snp。总的来说,大部分的snp是非同义(55%),表明结核分枝杆菌的清爽净化选择在短的时间内,如前所报道[12]

详细的人口结构和精确的哈勒姆应变传播从1997年到今天可以可视化的最小生成树基于对齐85验证单核苷酸多态性(图1S2A)。WGS披露的存在不同基因型由1997年11个snp,指示错误的集群由古典的pcr分离从第一年。

缩略图
图1所示。最小生成树分析。

最小生成树允许的假想节点Mtb疫情在汉堡和石勒苏益格-荷尔斯泰因州。年的隔离是由颜色编码。汉堡的HH,汉萨同盟的城市;SH,石勒苏益格-荷尔斯泰因州。星号表示树的根决定通过比较外集团(H37Rv)。

https://doi.org/10.1371/journal.pmed.1001387.g001

隔离被细分为36单例具有独特的SNP概要文件和七个集群,包括从2 - 24隔离。大多数隔离(n= 72,84%)分组在一个分支,我们称之为“汉堡克隆”(图1)。的汉堡克隆在1998年首次分离,然后生成几个集群(包括最大的一个,24隔离),并不断孤立,直到最后的研究(图S2A)。相比之下,克隆无关汉堡少克隆扩张,导致只有一个集群有两个隔离。2002年之后,他们停止传播。此外,在2006年汉堡石勒苏益格-荷尔斯泰因州首次克隆传播,在基尔。独立,石勒苏益格-荷尔斯泰因州的第二大溢出发生在2010年,在Pinneberg。这两个事件是解决SNP-based树和检测不同的小删除特定于每个事件(图开通)。

这些数据显示,WGS-based分析解决了86隔离歧视性的水平远高于古典基因分型,,,另外,按照时间和空间扩张模式。然后我们考虑这是否高分辨率与接触者追踪数据和确定的变化观察水平证实了传输链。接触者追踪显示明确的传播之间的联系31例(33%),可组装成八个不同的链(图2)。高比例的菌株(19日31日的61%),接受了至少一个人际传播没有SNP差异在严格的条件下我们调用用于变体。剩下的39% (n= 12)显示不同最多由三个单核苷酸多态性(SNP概要文件图2),从而定义一个最大程度的基因组变异之间的隔离从确认传输链。

缩略图
图2。接触者追踪分析。

收到卫生当局接触者追踪数据映射所示的最小生成树图1。确定传动链被称为G1八国集团(右面板),和国籍(N)的信息,酒吧环境的一部分(M;黑匣子显示“是”),住宅情况(R;白框表示无家可归者)、酒精中毒(;黑框显示“是”),药物滥用(D;黑框显示“是”)。不同的SNP模式是显示在右边的面板。相同的模式在单传动链用0。德、德国;PL、波兰; TR,Turkey.

https://doi.org/10.1371/journal.pmed.1001387.g002

基于86年观察到的序列变异积累Mtb反映基因组克隆扩张至少14 y (图S3上半部分),我们确定一个时间尺度的演变Mtb的自然宿主。Coalescence-based分析估计核苷酸替代率为1×10−7每年每核苷酸替换站点(95%置信区间,0.6×10−71.5×10−7),即。,approximately 0.4 mutations per Mtb genome per year. When analyses were rerun on datasets with sampling dates permutated across isolates, divergence dates were much older and credible intervals much larger (图S3中间面板),显示我们的率的计算是基于一个真正的时间信号序列中的数据。率的计算也支持由一个线性回归root-to-tip距离最大似然树对隔离(日期图S3较低的面板)。

WGS分析显示优惠扩张的一个特定的克隆(即。,汉堡克隆)患者人群(图3一)。因此,我们试图计算出明显相对生殖健康的克隆。为此,我们做了一个近似的病例数代表估计每年的平均数量的后代生存的特定基因型或血统。值得注意的是,这两个汉堡克隆和无关的菌株表现出线性增长随着时间(图3 b)。然而,他们的斜坡上显著不同(图3 b)。根据两个斜坡的比例,明显不太成功的相对健康压力大约是两倍低(0.462)相比汉堡克隆。评估是否这些观察到的传播行为的差异可能是由于社会环境的差异各自的指数的病人,我们进行了深入调查,所有病人的社会背景特征基于设计良好的接触者追踪方法使用标准,实地问卷调查(见方法)。我们发现病人感染了汉堡克隆或无关的菌株没有按年龄差异,艾滋病毒感染、药物滥用、无家可归、或社会环境(最后以不稳定的家庭和酗酒;看到表1)。因此,我们没有确定对比社会或环境参数,将显然支持优先传输特定的克隆。总的来说,76%的患者受到疫情影响可以被认为属于同一环境(图3 c;表S2)。总共只有五个病人56 - 7%的患者感染了汉堡clone-were艾滋病毒阳性;然而,汉堡克隆开始传播的艾滋病毒阳性的患者群。最重要的是,在第一个2 y(1997和1998)所有的病人可以分配给相同的社会环境中在汉堡。

缩略图
图3。结核分枝杆菌的传播疫情在汉堡和石勒苏益格-荷尔斯泰因州。

(A)这个疫情不断孤立的成员在过去14个y。两个区分部分隔离,“汉堡克隆”,剩下的不成功的菌株所示。黑色箭头表示菌株在不同站点的第一个分解动作石勒苏益格-荷尔斯泰因2006年(基尔[K])和2010年(Pinneberg [P])。结核分枝杆菌(B)时间的情况下和他们的最小二乘回归。上部和底部块对应于汉堡克隆的菌株,如(一)所示。固体和虚线代表计算回归线条和95%置信区间边界,分别。请注意,这两个汉堡克隆和无关的菌株没有明显偏离线性增长在这个时间尺度,这意味着在流行相当恒定的选择系数。(C)探索环境设置映射所示的最小生成树图1

https://doi.org/10.1371/journal.pmed.1001387.g003

充分描述的基因背景优先传送汉堡克隆,我们完成了它的一个孤立的全基因组序列,生成指定应变7199/99,手工打造的基因组注释(图S4),使用结核分枝杆菌菌株H37Rv作为参考。H37Rv相比,基因组的7199/99略大(4421197个基点)。成对全基因组比对H37Rv应变的7199/99,和测序隔离F11 CDC1551[23],[24]透露,大规模基因组重组,主要因为转位因子(42%)和PPE / PE_PGRS基因(38%;表2)。少量的多态性影响编码区域,例如,损失的esxR(Rv3019c)和esx(Rv3020c),或由一个单核苷酸缺失mmpl2(Rv0507)。这个删除截断了mmpl2,这是一种跨膜蛋白家族中的一员;编码的一些地区可能参与脂肪酸运输[25]。然而,这些变化都是在86年爆发隔离,从而突显出基因组单核苷酸多态性在推动进化的重要角色在传输过程中。

缩略图
表2。结核分枝杆菌的基因组区域大于20 bp H37Rv,缺席(用“×”)在至少一个一致的压力。

https://doi.org/10.1371/journal.pmed.1001387.t002

讨论

我们的临床流行病学研究表明,WGS-based类型提供了有关决议大,纵向Mtb爆发比经典的基因更有效得多。Genome-based更好的接触者追踪信息和时空分析相关的病原体的传播模式。此外,我们可以确定一个时间尺度的结核分枝杆菌的进化在克隆扩张超过十年,80年人口>患者。我们估计的最大变异三个单核苷酸多态性在明确的人际传播活动作为解释的基准WGS未来genome-based分子流行病学数据。

结核病监测的效率依赖于准确的检测能力爆发在社区和跟踪正在进行的传输链,这需要临床分离株的鉴定与高歧视性的权力,在应变水平[9]。古典基因分型技术现在已经使用了超过20 y协助结核病监测。然而,它们的价值为准确界定传输链或图表特定菌株的传播已经被最近质疑genome-based分析[12],[13]。我们表明,与相同的隔离6110年由多达130个snp模式不同,不支持直接传播[12]

与经典6110年DNA指纹图谱和24-locus MIRU-VNTR打字、基因组测序确定一个特定的克隆,命名为“汉堡克隆”,主要研究了疫情的病原体在汉堡和石勒苏益格-荷尔斯泰因州。此外,全基因组多态性透露几个集群内的爆发和接触者追踪相关数据和已知的时空扩散到石勒苏益格-荷尔斯泰因州在两个独立的情况下,所看到的两个截然不同的集群(见图S2)。重要的是,准确界定这些传动链是几乎不可能单独使用古典接触者追踪,没有回顾指导基于WGS数据,大多数病人(见图3表1)与社会经济条件有利于向未知的接触传播[26]。我们的数据显示,所显示先前的调查[13]的力量WGS-based molecular-guided多用于结核病监测和控制,即使在有问题的设置。

额外工作的一项重大发现是,当全基因组变异发现疫情中分离出足够高的爆发来解决,明确的传播链的全基因组变异水平很低,限制在不超过三个单核苷酸多态性。从更具体的角度来看,这一结果显然不同于已知的只有其他类似研究,由Gardy和同事[13]。这些作者分析了32隔离从疫情仍在不列颠哥伦比亚省,发现他们所有人(包括流行病学有直接联系的那些)相隔至少18个snp。然而,许多这些snp在重复DNA被发现等地区的PPE / PE_PGRS基因家族和元素(40%),这通常是很难与短内容映射和分析测序技术[27]。同样,最初这些地区纳入自己的分析建议更多的snp,但没有发现的变异在这些地区被后续Sanger测序证实。因此,我们的研究结果还定义(即基因组的一部分。,excluding repetitive regions) that can be interrogated with a minimal risk of false positive detection of variation, which is an essential parameter to control when analyzing strains that are intrinsically closely related in a clonal outbreak.

我们的数据揭示了时间积累结核分枝杆菌的基因组变异传播在其自然人类宿主人口。这表明Mtb的发展大约10倍比耐甲氧西林的更慢金黄色葡萄球菌[22],[28],[29]。考虑最近确定猕猴模型中的结核分枝杆菌变异率为2.5×10−10每一代,无论疾病状态[30]结核分枝杆菌的替换率表明,平均世代时间22 h(95%置信区间,13 h 33 h),或每年400代。有趣的是,这些估计非常接近翻倍增长之前测量在实验室在营养丰富的文化条件[31]。基于测量的替代率,我们估计的最近共同祖先汉堡在1995年克隆存在(95%置信区间,1993年至1997年),因此几年爆发之前被发现。但是我们注意到,实际的世代时间可能会更短在人口自然比表示,作为我们的进化速率的估计不包括一个未知突变的比例可能远离人口通过选择和漂移超过14 y[32]

最后一个有趣的发现揭示了我们是WGS-based分析汉堡克隆导致增加病例数,包括几个集群,相比其他克隆,表明更有效的传播很长一段时间。鉴于细菌之间的复杂的相互作用、人类和环境因素影响结核病传播,几种解释可能占这种不均匀膨胀,社会环境等因素,或接触的强度和持续时间,或特征,来源情况[33],[34]。结核分枝杆菌超级撒布机的存在会加速传播[13]。值得注意的是,我们并没有发现在统计上有显著差异的社会环境特征的病人之间汉堡克隆组和病人感染其他隔离表1)。病人组主要由个人与一个酒鬼和无家可归的环境,很早就已经发现,接近爆发疫情[26]。虽然某个超级机引起的可能性较大的集群中发现WGS-based树(参见第一年图1)不能被排除在外,不支持这一假设的事实,即使这最大的集群由至少四个明确的独立的传动链。这样单一的参与(超级)撒布机疫情的爆发也会很难协调的线性增加病例数随时间的观察汉堡克隆和非汉堡克隆组(见图3)。因此,我们假设增加的情况下造成的汉堡克隆可能会导致一些小型基因变化之前积累了最初的传播(六个snp,其中3例非同义,因此可能有功能的后果在蛋白质水平),这可能加强这种克隆的健身。然而,这个假设很难证明,甚至使用可用的实验感染模型[35],[36]

总之,我们的研究表明潜在的WGS改善molecular-guided结核病监测和控制。我们设想,其进步的有效实施将不断加速的测序成本,减少广泛分布的所谓台式基因组测序[37]和即将到来的生物信息学的发展,促进快速和相关的解释结果数据在公共卫生和医疗环境。

支持信息

图S1。

6110年DNA指纹,spoligotype 24-locus MIRU-VNTR键入模式的爆发压力进行了分析。的是6110年乐队头寸规范化,这样分班模式菌株相互可比。重复单元24 MIRU基因座的数量显示在黄色阴影,切断从0(白色)35(红色)单位。是集群的基础上6110年指纹模式。单差异24-locus MIRU-VNTR用星号表示。

https://doi.org/10.1371/journal.pmed.1001387.s001

(TIF)

图S2。

最小生成树的爆发所指定的隔离的孤立。(一)新收集的隔离让假设节点集中在最小生成树。颜色代码对应图2。(B)映射的小删除所示的最小生成树图2。不同色调的紫色对应于特定的小删除。

https://doi.org/10.1371/journal.pmed.1001387.s002

(TIF)

图S3。

最大似然树显示序列变化爆发之间的隔离。每个隔离了一个特定的距离根(上半部分)。命名的菌株对应的内部实验室的钥匙。中间面板说明了随机切换日期在隔离的效果(排列1 - 5)估计的分歧时间(自最近的共同祖先(tmrca);手段和95%置信区间如图所示)。Root-to-tip距离策划反对孤立的日期(下图)。

https://doi.org/10.1371/journal.pmed.1001387.s003

(TIF)

图S4。

结核分枝杆菌的圆形表示基因组的7199/99。外缘显示碱基对规模;第二个圆圈代表所有标识编码序列在正向或反向链。第三个圈表示的分布大删除(红色),第四圈熊插入(黑),和第五的位置6110年元素。第六圈给GC内容;第七,内层的圆可视化GC倾斜。

https://doi.org/10.1371/journal.pmed.1001387.s004

(TIF)

表S1。

单核苷酸多态性在隔离调查决定。

https://doi.org/10.1371/journal.pmed.1001387.s005

(PDF)

表S2。

人口特征的86名患者。

https://doi.org/10.1371/journal.pmed.1001387.s006

(PDF)

确认

我们感谢美国埃勒斯医生在批判阅读。此外,我们感谢t . Ubben Radzio, t . Struwe-Sonnenschein, j . Zallet技术援助。

作者的贡献

构思和设计实验:AR TK SN。进行了实验:AR TK AR CR JB SN。数据分析:基于“增大化现实”技术的RD TK CR联合国JB TW SJ党卫军SR PS JK SN。造成试剂/材料/分析工具:AR RD TK CR联合国JB TW SJ党卫军SR PS JK SN。写了初稿的手稿:AR TK SN。导致了写作的手稿:AR RD TK CR联合国JB TW SJ党卫军分析PS JK SN。ICMJE作者阅读和满足标准188bet手机版188bet手机版:AR RD TK CR联合国JB TW SJ党卫军分析PS JK SN。同意手稿结果和结论:基于“增大化现实”技术的RD TK CR联合国JB TW SJ党卫军分析PS JK SN。

引用

  1. 1。染料C,威廉姆斯BG(2010)的种群动态和控制结核病。科学328:856 - 861。
  2. 2。世界卫生组织(2012)2012年全球肺结核报告。可用:http://www.who.int/tb/publications/global_report/en/index.html。2013年1月8日通过。
  3. 3所示。读AF(1994)毒性的进化。趋势Microbiol 2: 73 - 76。
  4. 4所示。范大白鹅JD,洞穴MD,克劳福德JT,戴尔JW, Eisenach KD, et al。(1993)的识别结核分枝杆菌DNA指纹分析:建议一个标准化的方法。中国Microbiol 31: 406 - 409。
  5. 5。Kamerbeek J, Schouls L, Kolk,范Agterveld M, van Soolingen D, et al。(1997)同时检测和应变的分化结核分枝杆菌诊断和流行病学。中国Microbiol 35: 907 - 914。
  6. 6。供应P C Allix Lesjean年代,Cardoso-Oelemann M, Rusch-Gerdes年代,et al . (200