梅根宏基因组数据的分析

  1. Daniel h . Huson1,3,
  2. 亚历山大·f·欧什1,
  3. 霁气2,
  4. Stephan c·舒斯特尔2,3
  1. 1图宾根大学生物信息学中心沙14日72076图宾根,德国;
  2. 2比较基因组学和生物信息学中心中心传染病动力学,宾州州立大学大学公园,宾夕法尼亚州16802,美国

文摘

宏基因组研究生物体的基因样本的内容从一个共同的栖息地使用定向或随机排序。目标包括理解微生物多样性的范围和作用。这样一个样本的分类内容通常是估计相比之下对已知序列的序列数据库。大多数已发表的研究使用的分析paired-end读取,完成环境fosmid和BAC克隆,序列或环境组件。新兴的sequencing-by-synthesis技术与低成本非常高吞吐量铺平了道路随机“猎枪”的方法。介绍了梅根,一种新的电脑程序,它可以让笔记本大宏基因组数据集的分析。在一个预处理步骤中,DNA序列的集合比较针对数据库使用爆炸或另一个已知的序列比较工具。梅根然后用于计算和探索的分类内容的数据集,采用NCBI分类总结和秩序的结果。最低一个简单算法分配读取共同祖先类群这样分配的分类单元的分类水平反映了序列的保护水平。该软件可以分析大型数据集不需要组装或针对特定的系统发育标记。 It provides graphical and statistical output for comparing different data sets. The approach is applied to several data sets, including the Sargasso Sea data set, a recently published metagenomic data set sampled from a mammoth bone, and several complete microbial genomes. Also, simulations that evaluate the performance of the approach for different read lengths are presented.

脚注

| 表的内容
188滚球软件开放获取的文章

这篇文章

  1. 基因组Res。17:377 - 386 版权©2007,冷泉港实验室出版社

文章类别

分享

预印本服务器

最近的更新

在twitter上关注我们

大多数读文章

查看所有…



生命科学联盟