梅根宏基因组数据的分析
文摘
宏基因组研究生物体的基因样本的内容从一个共同的栖息地使用定向或随机排序。目标包括理解微生物多样性的范围和作用。这样一个样本的分类内容通常是估计相比之下对已知序列的序列数据库。大多数已发表的研究使用的分析paired-end读取,完成环境fosmid和BAC克隆,序列或环境组件。新兴的sequencing-by-synthesis技术与低成本非常高吞吐量铺平了道路随机“猎枪”的方法。介绍了梅根,一种新的电脑程序,它可以让笔记本大宏基因组数据集的分析。在一个预处理步骤中,DNA序列的集合比较针对数据库使用爆炸或另一个已知的序列比较工具。梅根然后用于计算和探索的分类内容的数据集,采用NCBI分类总结和秩序的结果。最低一个简单算法分配读取共同祖先类群这样分配的分类单元的分类水平反映了序列的保护水平。该软件可以分析大型数据集不需要组装或针对特定的系统发育标记。 It provides graphical and statistical output for comparing different data sets. The approach is applied to several data sets, including the Sargasso Sea data set, a recently published metagenomic data set sampled from a mammoth bone, and several complete microbial genomes. Also, simulations that evaluate the performance of the approach for different read lengths are presented.
脚注
↵3相应的作者。
↵3电子邮件huson在{}informatik.uni-tuebingen.de;传真49-7071-295148。
↵3电子邮件scs在}{bx.psu.edu;传真:(814)863 - 6699。
梅根是免费的http://www-ab.informatik.uni-tuebingen.de/software/megan)
文章发表之前打印。文章和出版日期http://www.genome.org/cgi/doi/10.1101/gr.5969107
-
- 收到2006年9月19日。
- 接受了2006年12月19日。
免费在线通过基因组研究188滚球软件开放获取的选择。
- 版权©2007,冷泉港实验室出版社