一个集成的百科全书在人类基因组中DNA的元素

编码项目财团

自然体积489年,页面57- - - - - -74年(2012年)引用这篇文章

33 k访问
7509年引用
760年Altmetric
指标细节

主题

文摘

人类基因组编码生命的蓝图,但绝大多数的功能其近三十亿基地是未知的。百科全书的DNA元素(编码)项目系统映射区域的转录,转录因子协会,染色质结构和组蛋白修饰。这些数据使我们能够分配生化功能基因组的80%,特别是在研究蛋白质编码区域。许多发现的候选监管元素彼此身体相关表达基因,基因调控机制提供了新的见解。新发现的元素也显示一个统计对应的序列变异与人类疾病有关,并且可以从而指导解释这种变化。总的来说,该项目提供了新的见解的组织和监管我们的基因和基因组功能注释和是一个广阔的资源用于生物医学研究。

下载

主要

编码DNA元素的百科全书nature.com/encode

人类基因组序列为人类生物学提供了底层代码。尽管深入研究,特别是在确定蛋白质编码基因,我们理解的基因组还远未完成,特别是关于非编码rna,或者拼接成绩单和监管序列。系统分析记录和监管信息至关重要基因的鉴定和监管区域,和人类生物学研究是一个重要的资源和疾病。这种分析也可以提供全面的视图的组织和跨细胞基因变异和监管信息情况下,物种和个体。

DNA序列元素的百科全书(编码)项目旨在描绘所有的功能元素在人类基因组中编码^1,2,3。操作上,我们定义了一个功能性元素作为一个离散的基因组片段编码定义产品(例如,蛋白质或非编码RNA)或显示一个可再生的生化特征(例如,蛋白结合,或一个特定的染色质结构)。比较基因组研究表明,3 - 8%的基地正在净化(消极的)选择^4,5,6,7,8因此可能功能,虽然其他的分析提出了更高的预期^9,10,11。覆盖1%的基因组在试点阶段,编码项目注释60%的哺乳动物的进化约束的基地,但还发现了许多其他公认的功能性元素没有约束的证据²。现在更强大的DNA测序技术的出现使全基因组和更精确的分析和广泛的功能分析。

在这里,我们描述了1640年生产和初步分析数据集设计在整个人类基因组注释的功能元素。我们整合来自不同实验结果在细胞类型,相关实验涉及147种不同的细胞类型,和所有编码数据与其他资源,如候选人地区从全基因组关联研究(GWAS)和进化限制区域。在一起,这些努力揭示重要特征对人类基因组的组织和功能,总结如下。

•绝大多数(80.4%)的人类基因组至少参与一个生化RNA -和/或chromatin-associated事件至少在一个细胞类型。基因组的谎言接近监管事件:95%的基因组在8个碱基(kb) dna蛋白质相互作用(如化验绑定ChIP-seq图案或DNase我脚印),和99%在1.7 kb的至少一个生化事件的编码。

•Primate-specific元素以及元素没有检测到哺乳动物约束显示,总的来说,负选择的证据;因此,他们中的一些人预计将功能。

•分类基因组为七个染色质状态表示一组初始的399124个地区与promoter-like enhancer-like特性和70292个地区特性,以及成千上万的静止区域。高分辨率分析进一步细分基因组为成千上万的狭窄的状态具有不同的功能特性。

•可以关联定量RNA序列生产加工与染色质标记和启动子转录因子结合,表明启动子功能可以解释大部分的RNA表达的变化。

•许多非编码变异个体基因组序列躺在ENCODE-annotated功能区域;这个数字至少是那些躺在蛋白编码基因一样大。

•单核苷酸多态性(snp)与疾病相关的GWAS浓缩在非编码的功能元素,与多数居住在或接近ENCODE-defined蛋白编码基因以外的区域。在许多情况下,这种疾病表型可以关联到一个特定的细胞类型或转录因子。

编码数据生产和初步分析

自2007年以来,编码开发方法和执行大量的序列研究映射整个人类基因组的功能元素³。映射的元素(和方法使用)包括RNA转录区域(RNA-seq笼,RNA-PET和人工注释),蛋白质编码区域(质谱),transcription-factor-binding网站(ChIP-seq和DNase-seq),染色质结构(DNase-seq FAIRE-seq,组蛋白ChIP-seq和MNase-seq),和DNA甲基化网站(rrb试验)(箱1列表方法和缩写;补充表1节P,细节生产统计数据)³。在不同的实验室,比较和整合结果数据生产的努力集中在两组选择的细胞系,指定“一级”和“二级”(箱1)。捕捉范围更广泛的生物多样性,选择化验也执行第三层包括超过100细胞类型包括的主要细胞。所有可用的数据和协议描述http://www.encodeproject.org/和用户指南包括程控的细节的选择和限制是最近出版的³。

集成方法

为了一致性,数据生成和加工使用标准化的指导方针,和一些化验,新的质量控制措施的设计(见参考文献3,12和http://encodeproject.org/ENCODE/dataStandards.html;a . Kundaje个人沟通)。统一的数据处理方法为每个试验(见发达补充信息;a . Kundaje个人通信),大多数试验结果可以作为信号信息(每个基站估计整个基因组)和离散元素(地区计算确定为丰富信号)。广泛的处理管道开发生成每个表示(m·m·霍夫曼et al。在准备和a . Kundaje手稿,个人沟通)。此外,我们开发了不能再现的发现率(IDR)¹³测量提供一个健壮的和保守的估计的阈值两个排名列表从生物复制的结果不再同意(也就是说,不能复制的),我们应用这个定义的离散元素集。我们确认,排除在分析,大部分区域产生不可靠的信号可能出土文物(例如,multicopy地区)。在一起,这些地区占0.39%的基因组(见补充信息)。这个问题是不同的ENCODE-identified附带的海报元素及其基因组覆盖率。

转录和蛋白质编码区域

我们使用手动和自动注释产生全面的人类蛋白质编码和非编码rna以及假基因,称为GENCODE参考基因集^14,15(补充表1,部分U)。这包含了20687个蛋白编码基因(GENCODE注释,v7),平均6.3或者拼接记录每个轨迹不同蛋白质编码记录(3.9)。总的来说,GENCODE-annotated蛋白编码基因的外显子覆盖2.94%的基因组蛋白质编码外显子或1.22%。从最外层蛋白编码基因跨越33.45%开始停止密码子,从启动子或39.54%聚(A)的网站。质谱数据的分析从K562和GM12878细胞株产生57自信确定独特的肽序列基因间区域相对于GENCODE注释。结合基因组转录无处不在的证据¹⁶,这些数据表明,额外的蛋白质编码基因仍有待发现。

此外,我们注释8801自动派生小RNA和9640手动策划长非编码RNA (lncRNA)位点¹⁷。lncRNAs比作其他编码数据表明lncRNAs生成蛋白质编码基因通过类似的途径¹⁷。GENCODE项目还注释11224假基因,其中863是转录和染色质与活跃¹⁸。

核糖核酸

我们测序RNA¹⁶从不同的细胞系和多个亚细胞分数来开发一个广泛的RNA表达的目录。使用保守的RNA的阈值来确定地区活动,62%的测序基因组基地可重复代表长(> 200个核苷酸)RNA分子或GENCODE外显子。这些基地,只有5.5%被GENCODE外显子解释道。大多数转录基地内或重叠带注释的基因边界(即intronic),只有31%的基地测序转录基因间¹⁶。

我们使用CAGE-seq (5′cap-targeted RNA隔离和测序)转录起始点的识别62403 (tss)高信心0.01 (IDR)层1和2细胞类型。其中,27362例(44%)在100个碱基对(bp)的5′末端GENCODE-annotated成绩单或之前报道全身的信使RNA。其余地区主要和3′外显子躺在区域(utr),和一些展览cell-type-restricted表达式;这些可能代表一开始网站的小说,cell-type-specific记录。

最后,我们看到了很大一部分的编码和非编码转录加工成稳态稳定比200个核苷酸短rna。这些前体包括转移核糖核酸、小核RNA和小核仁的微RNA, RNA(分别为tRNA, microRNA、核内小RNA和snoRNA)和这些加工产品的5′末端结合封顶5′末端标记¹⁶。

蛋白结合的区域

直接识别监管区域,我们绘制了绑定的位置119种不同的dna结合蛋白质和RNA聚合酶组件的数量在72年使用ChIP-seq细胞类型(表1,补充表1,部分N和裁判。19);87(73%)被sequence-specific转录因子。总的来说,636336个绑定地区占地231 megabases (Mb;8.1%)的基因组区域富集受dna结合蛋白在所有类型的细胞。我们评估每个此种网站已知dna结合蛋白的浓缩主题和小说主题的存在。总体来看,86%的DNA片段被sequence-specific转录因子包含一个强大的DNA结合主题,而且在大多数(55%)例已知的主题是最丰富(p . Kheradpour和m . >手稿准备)。

表1总结分析编码转录因子的类

全尺寸表

此种地区缺乏高同源或中度亲和力识别网站平均分数的排名低于21%的地区(Wilcoxon排名和识别序列P值< 10⁻¹⁶)。百分之八十二的低信号地区的高亲和性识别序列的其他因素。此外,当ChIP-seq山峰排名由他们与已知的识别序列的一致性,中位数DNase我可访问性是两个在底部20%的峰值高于上80%(基因组结构调整(GSC)^20.P值< 10⁻¹⁶),与以前的观测一致^21,22,23,24。我们推测低信号区域要么lower-affinity网站²¹或间接目标区域相关转录因子通过与其他因素的相互作用(参见参考文献25,26)。

我们组织所有的信息与每个转录factor-including ChIP-seq山峰,发现组蛋白的化学修饰图案和相关模式FactorBook (http://www.factorbook.org;ref。26),一种公共资源,将随着项目的进行更新。

DNase我过敏的网站和脚印

染色质易访问性特征是DNase我过敏是监管DNA区域的标志^27,28。我们映射289万独特的重叠DNase我过敏的网站(dhs) 125年由DNase-seq细胞类型,绝大多数tss谎言远端^29日。我们也映射480万网站25显示nucleosomal交联减少了做的细胞类型,其中许多配合国土安全部。此外,我们使用微球菌的核酸酶绘制核小体在GM12878入住率和K562细胞^30.。

在一级和二级细胞类型中,我们发现了一个205109年的意思是国土安全部每细胞类型(在错误发现率(罗斯福)1%),包括平均1.0%的基因组序列在每个细胞类型,和总体的3.9%。平均98.5%的入住率的转录因子由编码映射ChIP-seq(集体,94.4%的所有110万个转录因子ChIP-seq山峰在K562细胞)内访问染色质DNase我定义的热点^29日。然而,少量的因素,特别是heterochromatin-bound压制性复合物(例如,TRIM28-SETDB1-ZNF274复杂^31日,32编码的TRIM28,SETDB1和ZNF274基因),似乎占据nucleosomal网站的一个重要部分。

利用基因组DNase我足迹^33,34在41个细胞类型我们确定了840万种不同DNase我足迹(罗斯福1%)²⁵。我们的新创主题发现DNase我足迹恢复∼90%的已知的转录因子主题,以及数以百计的小说的进化图案,许多显示高度cell-selective占用模式类似于主要的发展和组织的监管机构。

区域组蛋白修饰

我们检测染色体位置12个组蛋白修饰和变异46个细胞类型,包括一个完整的矩阵在一级和二级的八个修改。因为修改州可能跨越多个核小体,自己可以跨细胞群位置不同,我们使用一个连续信号测量的组蛋白修饰在下游分析中,而不是调用区域(m·m·霍夫曼et al。,在准备手稿;看到http://code.google.com/p/align2rawsignal/)。最强的峰样的组蛋白修饰,我们使用mac电脑³⁵描述丰富的网站。表2描述了不同的组蛋白修饰,峰值特征,总结他们的角色(参了》)。

表2总结编码组蛋白修饰和变异

全尺寸表

我们的数据显示,全球模式修改是高度可变的细胞类型,按照转录活性的变化。与以前的研究一致^40,41,我们发现可以使用不同的组蛋白修饰信息集成系统的功能属性分配给基因组区域(见下文)。

DNA甲基化

胞嘧啶的甲基化,通常在CpG二核苷酸,参与基因表达的表观遗传调控。启动子甲基化通常是与镇压,而基因的甲基化与转录相关的活动⁴²。我们使用了表示亚硫酸氢盐测序(rrb)剖面DNA甲基化定量82年平均每人120万论文认定的细胞系和组织非重复性的基因组论文认定(8.6%),包括论文认定基因间区域,近端启动子和基因内区(基因的身体)⁴³,但应该注意的是,rrb方法优先目标CpG-rich岛屿。我们发现96%的论文认定表现出差异甲基化在至少一个细胞或组织化验(k .瓦利et al。、个人通信)和DNA甲基化水平与染色质可访问性。最不定地常常在基因甲基化论文认定发现身体和基因间区域,而不是在启动子和上游监管区域。此外,我们发现一个意想不到的对应unmethylated基因的CpG岛P300和绑定,一个组蛋白乙酰转移酶与增强子活动⁴⁴。

因为rrb与单碱基序列分析解决,我们能够识别论文认定allele-specific甲基化与基因组印记一致,并确定这些位点表现出异常的甲基化在癌症细胞系(k .瓦利et al。个人沟通)。此外,我们发现可再生的胞嘧啶甲基化在成人CpG二核苷酸外组织⁴⁵提供进一步的支持,这个非规范甲基化事件可能有重要的作用在人类生物学(k .瓦利et al。个人沟通)。

Chromosome-interacting地区

物理之间的相互作用不同的染色体区域,可以由数百个碱基被认为是重要的基因表达的调节⁴⁶。我们使用两种互补染色体构象捕获(3 c)的技术来探测这些远程物理交互。

3 c-carbon副本(5 c)的方法^47,48提供公正的检测与tss远程交互目标1%的基因组(44编码试点地区)在四个细胞类型(GM12878、K562 HeLa-S3和H1 hESC)⁴⁹。我们发现了数以百计的统计学意义在每个远程交互后细胞类型占染色质聚合物和实验变异行为。对相互作用位点表明基因表达水平的相关性强TSS和特定功能增强剂等元素类。远端元素相互作用TSS的平均数为3.9,和TSS的平均数为2.5,与远端交互元素表示一个复杂的网络互联染色质。这种交织远程架构也发现了全基因组与paired-end标记使用染色质交互分析测序(ChIA-PET)⁵⁰应用于识别交互染色质丰富的RNA聚合酶II (Pol II)芯片从五个细胞类型⁵¹。在K562细胞中,我们确定了127417年promoter-centred染色质交互使用ChIA-PET,其中98%是intra-chromosomal。而2324个基因的启动子区域参与了“单基因”enhancer-promoter交互,的19813个基因参与的多基因相互作用复合物生成几个megabases,包括promoter-promoter和enhancer-promoter交互⁵¹。

这些分析描述复杂的远程景观基因要素连接在数百个碱基数megabases范围,包括相互作用无关的基因(补充图1,部分Y)。此外,在5度结果,50 - 60%的远程交互发生在只有一个的四个细胞系,表明高度的组织特异性基因要素连接⁴⁹。

总结ENCODE-identified元素

占所有这些元素,令人惊讶的是,相当大的一部分人类基因组,80.4%,是由至少一个ENCODE-identified元素(详细补充表1,部分Q)。最广泛的元素类代表不同的RNA类型,覆盖62%的基因组(虽然多数基因内含子内或附近)。地区第二大组蛋白修饰形式类高纯度(56.1%)。不包括RNA和广泛的组蛋白元素,基因组的44.2%。小比例的基因组被占领地区开放的染色质的转录因子(15.2%)或网站绑定(8.1%),有19.4%由至少一个国土安全部或转录因子在所有细胞系ChIP-seq高峰。用我们最保守的评估,8.5%的基地是由transcription-factor-binding-site主题(4.6%)或国土安全部足迹(5.7%)。然而,这仍高出4.5倍数量的蛋白质编码外显子,和两个高于pan-mammalian约束的预计金额。

考虑到编码项目没有化验所有细胞类型,或全部转录因子,特别是抽样一些专业或发育限制细胞谱系,这些比例必须低估总额的功能基础。然而,许多分析进行多个细胞类型,允许评估发现的新元素。国土安全部和CTCF-bound网站,新元素最初的数量增加迅速,陡坡的饱和曲线,然后放缓与越来越多的细胞类型(补充无花果1和2,部分R)。与当前数据,在最平的饱和曲线的一部分,每一个新的细胞类型补充说,平均而言,9500年国土安全部元素(在106个细胞类型)和500 CTCF-binding元素(在49个细胞类型),代表元素数量总数的0.45%。我们模仿饱和度国土安全部和CTCF-binding网站使用威布尔分布(r²> 0.999)和预测饱和约410万(标准错误(东南部)= 108000)和185100年(王新宏。= 18020)网站,分别,这表明我们已经发现大约一半的估计总国土安全部。这些代表一个下界估计,但加强观察,有更多的非编码DNA功能比编码序列或哺乳动物的进化约束基地。

选择的功能元素的影响

从比较基因组研究,至少有3 - 8%的基地正在净化(消极的)选择^{4,5,6,7,8,9,10,11},这表明这些基地可能潜在的功能。我们之前发现60%的哺乳动物进化限制基地在编码注释的试点项目,但也注意到,许多功能元素缺乏约束的证据²,结论证实^52,53,54。现在的多样性和全基因组发生功能元素识别提供了一个前所未有的机会来检查进一步负面的力量选择对人体功能的序列。

我们检查负选择使用两个措施,强调在人类基因组中不同时期的选择。第一个测量,跨物种,pan-mammalian约束(GERP-based分数;24的哺乳动物⁸),地址在哺乳动物的进化选择。第二个措施是intra-species约束估计数字的变异在人类发现使用数据从1000人基因工程⁵⁵人类进化,包括选择。在图1,我们把这两种措施的约束不同类别的识别功能元素,不包括功能重叠的外显子和已知约束的推动者。每个图还显示了基因组背景水平和措施coding-gene约束进行比较。因为我们把人口多样性倒置的规模,元素,更受到消极的选择往往会躺在上面和右边区域的阴谋。

我DNase元素(图1 b)和绑定主题(图1 c),大多数的元素显示浓缩pan-mammalian约束和减少人口的多样性,尽管对一些细胞类型DNase我网站不似乎整体pan-mammalian约束。结合转录因子主题设置的有一种天然的控制转录因子主题以同样的顺序可能绑定但没有绑定的证据ChIP-seq实验所有情况下,结合主题显示更多的哺乳动物的约束和更高的抑制人类的多样性。

与先前的研究一致,我们不遵守全基因组的证据pan-mammalian选择新颖的RNA序列(图1 d)。也有大量的元素没有哺乳动物的约束,在17%和90%之间transcription-factor-binding地区以及国土安全部和做区域。先前的研究不能确定这些序列是活跃的生化反应,但是没有整体对生物体的影响,或者在lineage-specific选择。通过隔离优先序列插入到灵长类动物血统,这是唯一可行的全基因组规模的这些数据,我们能够专门研究这个问题。大多数primate-specific序列是由于逆转录转座子的活动,但是一个明显的比例非重复性的primate-specific序列。104343413年primate-specific基地(不含重复元素)、67769372年(65%)被发现在ENCODE-identified元素。检查227688个变异在这些primate-specific隔离区域显示所有类别的元素(RNA和监管)显示抑郁派生等位基因频率,符合最近的负选择发生在至少其中一些地区(图1 e)。另一种方法检查序列不清楚pan-mammalian约束下显示出相似的结果(l .病房和m >手稿提交)。这表明一个可观的比例所需的无约束元素lineage-specific元素生物的功能,符合长期最近进化的观点⁵⁶,其余的可能是“中性”的元素²不是目前正在选择但仍可能影响细胞或大规模表型对健康没有影响。

转录因子的结合模式不统一,我们可以联系国米和intra-species措施负选择的主题的整体信息内容的位置。选择一些主题头寸高达蛋白质编码外显子(图1 f;l .病房和m . >手稿提交)。这些综合措施在图案显示绑定偏好人群中发现的网站也是一个网站相关的行为。通过开发一个网站的人口指标影响主题,我们发现高度约束绑定实例在哺乳动物能够缓冲个体变异的影响⁵⁷。

箱1:编码缩写

RNA-seq。隔离的RNA序列,通常用不同的净化技术来分离不同分数的RNA高通量测序紧随其后。

笼子里。捕获的甲基化帽在RNA 5′末端,紧随其后的是高通量测序的小标签毗邻5′甲基化帽。5′甲基化形成限制在转录的起始,尽管其他机制也混入甲基5′末端的RNA。

RNA-PET。同时捕获的RNA 5′甲基帽和聚(a)的尾巴,这是表明一个完整的RNA。接着是通过测序一个短标签从两端高通量测序。

ChIP-seq。染色质免疫沉淀反应测序紧随其后。特定区域的交联染色质,基因组DNA在复杂的蛋白质,利用抗体选择特定的抗原决定基。然后浓缩样品进行高通量基因组测序确定地区最常受蛋白质的抗体是导演。最常用的是任何chromatin-associated抗体表位,包括转录因子、染色质结合蛋白和特定的化学修饰组蛋白蛋白质。

DNase-seq。适应建立监管序列分析的现代技术。DNase我酶将优先削减生活染色质准备在附近的地点有特定的蛋白质(non-histone)。由此产生的切割点然后使用高通量测序测序以确定这些网站“高度敏感”DNase我,对应于开放的染色质。

FAIRE-seq。甲醛协助监管元素的隔离。做隔离nucleosome-depleted基因组区域利用核小体之间的交联效率的差异(高)和sequence-specific监管因素(低)。做由交联、苯酚萃取,水相中的DNA片段测序。

rrb。亚硫酸氢盐测序减少表示。亚硫酸氢盐处理的DNA序列转换unmethylated胞核嘧啶尿嘧啶。集中分析和节约成本,周围特定的限制性内切酶切割CpG二核苷酸可以减少基因组部分在论文认定特别丰富。这浓缩样品测序确定单个胞核嘧啶定量的甲基化状态。

一级。一级细胞类型是最高优先级的设置和由三个广泛研究的细胞系:K562 erythroleukaemia细胞;GM12878 B-lymphoblastoid细胞系,也是1000人基因工程的一部分(http://1000genomes.org)⁵⁵;和H1胚胎干细胞(H1 hESC)线。

层2。第二考虑的细胞类型编码项目包括HeLa-S3宫颈癌细胞HepG2肝胚细胞瘤细胞和初级(非转换)人类脐静脉内皮细胞(HUVECs)。

层3。其他编码细胞类型而不是一级或二级。

编码数据集成与已知的基因特性

Promoter-anchored集成

许多编码分析直接或间接提供的信息促进剂的作用。关注的tss蛋白质编码记录,我们调查了不同的编码分析之间的关系,特别是测试假设RNA表达(输出)可以有效地预测模式的染色质修饰或转录因子绑定(输入)。与先前的报告相一致⁵⁸,我们观察两个相对不同的启动子类型:(1)广泛,主要是(C + G)丰富,TATA-less推动者;(2)狭窄,TATA-box-containing推动者。组蛋白修饰这些启动子具有不同的模式,transcription-factor-binding网站选择性地富集在每个类(补充图1,部分Z)。

我们开发了预测模型探讨组蛋白修饰之间的交互和措施启动子的转录区分修改添加称为转录的结果(如H3K36me3和H3K79me2)和其他类别的组蛋白标记⁵⁹。在我们的分析,最好的模型有两个组件:一个初始分类组件(开/关)和第二个定量模型组件。我们的模型显示,激活乙酰化标志(H3K27ac和H3K9ac)大致一样的激活甲基化标记(H3K4me3和H3K4me2) (图2一个)。虽然压抑的标志,如H3K27me3或H3K9me3,显示负相关个人和模型中,删除这些标记产生只有一小减少模型的性能。然而,对于每个细胞株启动子的一个子集,压抑的组蛋白标记(H3K27me3或H3K9me3)必须被用来预测他们的准确表达。我们还检查H3K79me2和H3K36me3标志之间的相互作用,这两个标记基因的身体,可能反映了招聘修饰酶的聚合酶亚型。如前所述,H3K79me2发生优先基因5′末端的身体和H3K36me3发生更多的3′,和我们的分析支持前面的模型H3K79me2 H3K36me3转变发生在第一个3′拼接的网站⁶⁰。

图2:**造型从组蛋白修饰和转录水平transcription-factor-binding模式。**

一些先前的研究试图建立定性或定量模型的全基因组转录从转录因子水平,因为缺乏记录transcription-factor-binding地区和周围的缺乏协调一个细胞系。我们因此检查transcription-factor-binding信号的预测能力对启动子的表达水平(图2 b)。与组蛋白修饰的概要文件,大多数转录因子显示丰富绑定TSS附近的信号在一个狭窄的DNA区域,使用相对较高绑定信号启动子高CpG内容。大多数这种相关性可以通过查看总完成绑定没有特定的转录因子的转录因子。在一起,这些相关性模型表明,一组有限的染色质是都足以解释的转录,多种转录因子可能有广泛的角色通常在许多基因转录水平。重要的是要注意,这是一个天生的观察性研究的关联模式,符合各种机械模型和不同染色质之间的因果关系,转录因子和RNA化验。然而,它确实表明有足够的信息出现在基因的启动子区域来解释大部分的RNA表达的变化。

我们开发了预测模型用来模拟类似转录活动探索之间的关系水平的组蛋白修饰和外显子的交替在拼接记录。甚至占表达水平,H3K36me3有积极贡献外显子包容,而H3K79me2 (h . Tilgner负贡献等手稿做准备)。通过监测RNA数量在K562细胞的亚细胞分数,我们发现基本上所有拼接co-transcriptional^61年,进一步支持染色质结构和连接之间的联系。

Transcription-factor-binding site-anchored集成

Transcription-factor-binding网站提供一个自然集中在探索染色质属性。转录因子通常是多功能的,可以结合各种基因位点的不同组合和染色质标记和核小体组织的模式。因此,而不是平均染色质马克概要文件在所有转录因子的结合位点,我们开发了一个聚类过程,称为集群聚合工具(CAGT),确定共享相似但不同的模式的结合位点子集染色质标记信号大小,形状和隐藏的方向性^30.。例如,平均的压抑的组蛋白标记H3K27me3在H1为其所有55782 CTCF-binding网站显示信号差浓缩(图3)。然而,信号幅度分组资料后我们发现9840(17.6%)的一个子集CTCF-binding网站,表现出显著的侧翼H3K27me3信号。形状和方向分析进一步表明,主要的信号剖面H3K27me3 CTCF高峰会议是不对称的,符合一个边界的角色之间的一些CTCF网站活跃和polycomb-silenced域。提供了进一步的例子补充无花果5和6TAF1部分大肠的主要tss附近发现,转录的不对称网站面向的方向。然而,对于远端网站,比如那些受GATA1 CTCF,我们还观察到一个高比例的非对称组蛋白模式,虽然独立于主题方向性。事实上,所有transcription-factor-binding数据集在所有细胞系主要表现不对称模式(不对称比> 0.6)为所有染色质标记而不是DNase我信号(图3 b)。这表明大多数transcription-factor-bound染色质事件与结构化、定向的组蛋白修饰模式,启动子的方向并不是唯一来源定位在这些网站。

图3:**模式和不对称的染色质修饰transcription-factor-binding网站。**

我们还研究了核小体入住率相对于染色质标记的对称性transcription-factor-binding网站。tss左右,通常有强烈的非对称核小体入住率,通常占大多数的组蛋白修饰信号(例如,见补充图4,部分E)。然而,远离tss、更和谐。例如,CTCF-binding网站通常显示阵列定位准确的核小体两侧的高峰会议(补充图1部分E)^62年。侧翼的染色质标记信号高、信号往往不对称,说明微分与组蛋白修饰标记(补充无花果2和3部分E),因此,我们在全基因组范围内确认转录因子可以形成壁垒的核小体和组蛋白修饰被安排在不同的配置^{62年,63年,64年,65年}。这是参中进一步详细地探讨25,26和30.。

转录因子co-associations

Transcription-factor-binding区域非随机分布在整个基因组,对其他功能(例如,启动子)和其他Transcription-factor-binding地区。在层1和2细胞系,我们发现3307对统计co-associated因素(P< 1×10⁻¹⁶GSC)涉及114(满分117分)的因素(97%)(图4)。这些包括预期关联,如小君和安全系数,和一些不太期望小说协会,如TCF7L2 HNF4-α和FOXA2 (ref。66年;给出了一个完整的清单补充表1,部分F)。当一个人认为单独启动子和基因间区域,这改变3201对(116因素,99%)启动子和1564对(108因素,92%)基因间区域,有一些关联更具体的对这些基因组上下文(例如,集群HDAC2, GABPA, CHD2, GTF2F1, MXI1 MYC基因启动子区域和SP1, EP300, HDAC2 NANOG在基因间区域(图4 b))。这些通用和上下文相关的协会导致的网络表示co-binding与许多有趣的特性,探讨了参考文献19,25和26。此外,我们还发现了一组区域受多种因素代表高入住率的转录因子(热)地区^67年。

全基因组整合

识别功能基因组区域,我们下一个综合元素使用独立的基因组地标有识别力的训练方法,已知元素的一个子集的一个特定的类被用来训练模型被用来发现更多这类的实例,或者使用方法中只有数据编码化验使用没有任何注释的显性知识。

有识别力的培训中,我们使用一个三步过程预测潜在的增强剂,所描述的补充信息和裁判。67年。两种歧视模型聚集在一组∼13000年在K562细胞中假定的增强剂^67年。在第二个方法中,两种方法论上不同的无偏的方法(见参考文献40,68年霍夫曼和m . m .et al。,准备手稿)聚集在一套整合的组蛋白修饰和chromatin-accessibility模式,可用于基因组片段的一级和二级细胞株,虽然单个位点在每个州每个细胞株是不同的。除了RNA聚合酶II和CTCF的转录因子数据没有显著改变这些模式。在这个阶段,我们故意排除RNA和甲基化分析,保留这些数据来验证分割。

我们的集成的两种分割方法(m·m·霍夫曼et al。,在准备手稿)建立一套一致的七大类基因组,描述表3。标准的积极推动者,独特的核心启动子区域(TSS和PF状态),导致活跃基因的身体(T,转录状态),是重新发现了在这个模型(图5 a, b)。有三个“活跃”远端状态。我们暂时贴上两个作为增强剂(预测增强剂,E,并预测弱增强剂,我们)由于其发生地区开放的染色质H3K4me1高,尽管他们在H3K27ac等标志的水平不同,目前认为区分活跃的和不活跃的增强剂。其他活动状态(CTCF)高CTCF绑定,包括序列函数作为绝缘体在转染实验。剩下的压抑状态(R)总结序列分成不同类型的积极压抑或不活跃的,静止的染色质。我们发现在细胞类型CTCF-binding-associated状态是相对不变的,与个别地区经常占据CTCF的状态在所有六个细胞类型(图5度)。相反,E和T州有实质性的特异性行为,而TSS状态有一个双向行为具有类似数字cell-invariant和特异性的事件。重要的是要注意,共识总结类不捕获所有的细节中发现个人分割包含更多的州。

表3总结结合状态的类型

全尺寸表

RNA的分布物种跨段截然不同,表明分段捕获潜在的生物活性。腺苷RNA基因体内大量丰富。在启动子周围,有短RNA物种之前确认为promoter-associated短RNA (图5 b)^16,69年。同样,DNA甲基化显示显著区别部分,概括已知的主要生物学unmethylated积极推动者(TSS)其次是甲基化基因的身体⁴²(T状态,图5 d)。两个enhancer-enriched状态显示不同的DNA甲基化模式,与不活跃增强器状态(通过H3K27ac / H3K4me1水平)显示高甲基化。这些国家也没有过多的RNA元素聚(A)反面methyl-cap RNA,化验的笼子序列,基因间的匹配控制相比,表明一个特定的转录模式与活性增强有关^70年。转录因子也表现出不同的分布在段(图5 b)。惊人的模式是转录因子的浓度在TSS-associated状态。增强剂包含一组不同的转录因子。例如,在K562细胞,E为绑定状态是丰富的蛋白质编码的EP300,”丛书,FOSL1,GATA2,HDAC8,JUNB,JUND,NFE2,SMARCA4,SMARCB1,SIRT6和TAL1基因。我们测试了这些预测的一个子集增强剂在老鼠和鱼转基因模型(例子图6),超过一半的元素展示活动,通常在相应的组织类型。

分割提供了一个线性确定整个基因组的功能状态,但不是一个特定的基因与远端区域协会。通过使用跨细胞系DNase我信号的变化,39%的E(增强剂相关的)州可能与提议的调节基因^29日整合与地域邻近模式由5度决定的⁴⁹或ChIA-PET。

提供细粒度的区域分类,我们求助于自组织映射(SOM)集群基因组分割区域根据检测信号特征(图7)。分割区域最初随机分配到1350 -状态映射在一个二维环形空间(图7)。这张地图可以被可视化为二维矩形平面上可以绘制各种信号分布。例如,矩形的左下角图7显示了基因组的分布在初始随机地图。SOM被训练使用十二个不同ChIP-seq DNase-seq化验在之前6个细胞类型分析大规模分割(即超过72 -维空间)。训练后,SOM聚类又在二维可视化,现在显示的组织分布基因组片段(右下角的面板,图7)。单个数据集相关的基因组片段在每个SOM地图单位(六角形细胞)在同一框架可以可视化学习每个额外的数据分布在染色质状态的地图。图7 b显示笼/ TSS表达数据覆盖的随机初始化(左)和训练有素的地图(右)板。以这种方式训练有素的细胞类型特异的TSS SOM强调集群(底部面板图7 b),这表明有套组织相互区别的tss的微妙的组合编码染色质数据。许多ultra-fine-grained状态分类显示的SOM与特定的基因本体论(去)条款(右面板图7 c)。例如,左侧面板图7 c标识十SOM地图单位富含基因与基因组区域相关术语的免疫反应。中央面板标识一组不同的地图单位丰富的术语“sequence-specific转录因子的活动”。两个地图单位最丰富的词,表示最黑暗的绿色色素,含有基因高H3K27me3 H1为段,但在HUVECs H3K27me3水平不同。基因功能分析与本体工具(好了^71年)显示,地图单位H3K27me3高水平在两种细胞类型丰富转录因子基因与已知的神经功能,而邻近的地图单元丰富体内基因参与模式。基因组浏览器底部的照片图7 c挑出一个例子地区的两个SOM地图单位说明H3K27me3信号的差异。总体来说,我们有228个不同的术语与特定领域跨一个或多个州(a . Mortazavi个人通信),并可以分配超过三分之一的基因注释单独的基础上其多细胞组蛋白模式。因此,SOM分析提供了一个细粒度的跨多个细胞染色质数据类型的映射,可以用来与染色质结构,其他数据类型以不同层次的分辨率(例如,单位的大型集群包含任何活跃的TSS subclusters由单位丰富的TSS活跃在只有一个细胞类型,或者个人地图单位显著富集为特定条款)。

这里给出的分类分析和细胞系研究必然是有限的,而且可能含有许多异构类的元素。尽管如此,健壮的分类,允许人类基因组的系统视图。

洞察人类基因组变异

我们下一个序列变异的潜在影响进行了探讨编码功能元素。我们检查了allele-specific变异使用结果GM12878细胞来源于个体(NA12878) 1000基因组测序项目,连同她的父母。因为编码分析主要是基于三个设计允许每个GM12878数据集除以杂合的地点具体的贡献,产生聚合haplotypic信号从多个基因组网站。我们检查了193个编码化验allele-specific偏见使用1409992分阶段,杂合的SNPs和167096插入/删除(indels) (图8)。定位偏差对等位基因出现在参考基因组序列是避免使用一个序列在NA12878专门量身定做的变异和单体型(“个性化基因组”)^72年。我们发现优惠的实例绑定到每个父母等位基因。例如,比较的结果POLR2A, H3K79me2和H3K27me3化验NACC2(图8)展示了一个强大的父亲的偏见H3K79me2 H3K27me3 POL2RA和强烈的母性偏见,表明微分父系和母系等位基因的活动。

图8 b显示选择的相关性allele-specific信号在整个基因组。例如,我们发现一个强大的等位基因之间的相关性POL2RA BCLAF1绑定,以及H3K79me2和H3K27me3之间呈负相关,在基因(图8 b,低于对角线,左下)和染色体片段(右上角)。总的来说,我们发现积极的等位基因的相关性在193编码分析比负相关性更强、更频繁。这可能是由于优先捕获的等位基因和/或特定的组蛋白修饰和转录因子,分析在工程中使用。

罕见变异,个人基因组和体细胞变异

我们进一步研究了个体变异的潜在功能影响的环境中编码注释。我们NA12878变异分为常见和罕见的类,和这些这些重叠分区编码注释(图9和补充表1和2,部分K)。我们也预测潜在的功能作用:蛋白质编码基因,这些非同义snp或变异可能引起损失由框移函数,过早停止,或剪切位点中断;为其他地区,这些变异重叠transcription-factor-binding站点。我们发现类似数量的潜在功能变异影响蛋白质编码基因或影响其他编码注释,表明许多功能变体在个人基因组蛋白质编码基因的外显子之外。更详细的分析监管变体注释中描述ref。73年。

进一步研究NA12878基因组变异的潜在影响transcription-factor-binding地区,我们进行峰值使用个人二倍体基因组序列构造呼吁NA12878 (ref。72年)。我们从GM12878 ChIP-seq对齐序列分别对父系和母系的单。正如所料,更大一部分读取比参考基因组(见对齐补充信息,补充图1部分K),平均大约1%的transcription-factor-binding网站GM12878 haplotype-specific时尚细胞检测。例如,图9 bCTCF-binding网站显示没有检测到使用的参考序列,只是现在的单体型由于1-bp删除(见也补充图2,部分K)。DNA测序进一步降低成本,优化分析ENCODE-type数据应该使用个体或细胞的基因组序列分析。

大多数癌症基因组的分析到目前为止都聚焦于体细胞变异蛋白质编码区域的特征。我们交叉四个可用癌症全基因组数据集与编码注释(图9 c和补充图2,部分L)。总的来说,体细胞变异是相对减少编码注释区域,特别是对于特定细胞类型的元素匹配的假定的肿瘤来源(例如,皮肤黑色素细胞黑色素瘤)。检查在内含子元素的突变谱strand-specific突变情况下的任务可以显示有突变谱差异国土安全部和未经地区(0.06确切概率法,补充图3,部分L)。体细胞突变的抑制是符合这些元素在肿瘤细胞内的重要功能角色,强调潜在的替代组检查癌症的目标。

常见变异与疾病有关

近年来,GWAS极大地扩展我们的知识与人类疾病相关的基因位点的风险和其他表型。这些研究是一系列的输出单核苷酸多态性(GWAS SNPs)与表型相关,虽然不一定是功能变体。值得注意的是,88%的单核苷酸多态性intronic或基因间的关联^74年。我们检查了4860 SNP-phenotype协会4492个snp策划国家人类基因组研究所(NHGRI) GWAS目录^74年。我们发现12%的这些snp transcription-factor-occupied重叠区域而34%重叠国土安全部(图10)。两个数字反映重要的充实与1000人基因工程snp的整体比例(分别为6%和23%)。即使占偏差引入了snp的选择标准的基因序列,GWAS snp显示持续较高的重叠编码注释(图10,请参阅补充信息)。此外,密度分区后基因组的不同类型的功能元素,GWAS snp都丰富除了function-rich分区中的所有基因单核苷酸多态性,并在function-poor分区(见减少补充图1,部分M)。GWAS snp特别丰富的分割类与增强子和tss在几个细胞类型(见补充图2,部分M)。

检查综合编码注释的SOM(见上图),我们发现19 SOM地图单位显示重要的浓缩GWAS snp,包括许多SOM单位之前与特定的基因功能,如免疫反应区域。因此,相当大比例的单核苷酸多态性中确定初始GWAS扫描功能或躺在编码注释的长度(∼平均500个基点),代表合理的候选功能变体。扩大的可行集功能性单核苷酸多态性与合理的连锁不平衡,多达71%的GWAS SNP有潜在病因SNP重叠DNase我网站,和31%的SNP位点有候选人,重叠一个转录因子结合位点被(参见参考文献73年,75年)。

GWAS目录提供了丰富的功能分类的精确的表型被研究。这些表型分类与编码注释和非随机相关有显著的对应关系之间的表型和细胞类型的身份或转录因子编码中使用试验(图10 b)。例如,五个单核苷酸多态性与克罗恩病相关重叠GATA2-binding网站(P价值0.003通过随机排列或0.001 GWAS-matched snp通过实证方法比较;看到补充信息),14个位于国土安全部相关免疫细胞类型中找到。5号染色体上的一个著名的例子是一个基因沙漠p13.1包含八个单核苷酸多态性与炎症性疾病相关。数接近或在国土安全部辅助1型(T_H1)和T_H2细胞以及峰值的绑定HUVECs转录因子(图10 c)。后者细胞系并不是免疫,但入住率因素检测到可能会有一个代理绑定的一个更相关的因素,如GATA3、T细胞。也在这一地区影响表达水平的遗传变异PTGER4(ref。76年),EP4前列腺素受体编码。因此,编码数据加强假设基因变异在5 p13.1调节侧翼基因的表达,而且提供的特定假设一个叫因素的变异影响入住率allele-specific方式,从而影响对克罗恩病的易感性。

与编码细胞表型的联系加强了论点,至少一些GWAS铅snp功能或者非常接近功能变体。每个铅SNP和编码注释之间的联系仍然是一个可靠的假设一个特定的功能元素类或细胞类型和未来实验探索。补充表1 - 3、14885节,列出所有成对协会在整个编码注释。附带的文件有一个更详细的检查常见变异与其他监管信息^{19,25,29日,73年,75年,77年}。

结束语

功能元素的前所未有的数量确定在本研究提供了一个宝贵的资源,科学界以及显著增强我们对人类基因组的理解。我们的分析揭示了许多小说方面的基因表达和调控等的组织信息,附带插图的论文(见http://www.encodeproject.org/ENCODE/pubs.html收集编码出版物)。然而,仍然有许多具体细节,特别是关于机械的过程,生成这些元素和他们怎么没功能,这需要额外的实验来说明。

报道的大传播我们的最高分辨率,最保守的基地与GENCODE蛋白质编码基因外显子(2.9%)或特定的DNA结合蛋白(8.5%)最广泛,最一般的标志覆盖基因组(大约80%),与许多层次between-presents光谱发现的元素具有不同的功能特性的编码。总共99%的基因组中已知的基地是在1.7 kb的编码元素,而95%的基地是在结合转录因子8 kb的主题或DNase我足迹。有趣的是,即使使用最保守的估计,基地的分数可能参与直接的基因调控,虽然不完整,显著高于归因于蛋白质编码外显子(1.2%),提高的可能性更多信息在人类基因组中基因调控的可能是重要的比生化功能。许多监管元素并不限制在哺乳动物进化,而到目前为止最可靠的迹象之一的重要生化事件有机体。因此,我们的数据提供了同源指标暗示可能的功能元素。

第一次重要的是,我们有足够的统计能力评估的影响- primate-specific元素上的选择,和所有编码类显示负选择这些unique-to-primate元素的证据。此外,即使最保守的估计的功能元素(假定的DNA /蛋白结合区域的8.5%),假设我们已经取样的一半元素从转录因子和程控多样性,有人估计,至少20%(17%来自蛋白质绑定和2.9%的蛋白质编码基因外显子)基因组的参与这些特定功能,可能图更高。

编码注释的广泛覆盖提高了我们对常见疾病有遗传因素的理解,罕见的遗传疾病,癌症,如图所示,我们链接的能力否则匿名协会功能元素。编码和类似的研究提供一个第一步解释其他genome-beyond蛋白质编码genes-thereby增加常见疾病基因研究和可测试的假设。这些信息证明执行全基因组测序(而非外显子组,1.2%的基因组)罕见疾病和调查体细胞变异在非编码的功能元素,例如,在癌症。此外,GWAS分析通常将疾病snp在很大区域,比较编码非编码的功能元素可以帮助确定假定的因果变异除了精致精细定位位置的技术^78年。结合与allele-specific编码数据信息来源于个人基因组序列提供了特定的有关基因变异的影响。事实上,我们相信,一个重要的目标是使用功能等数据,来自这个项目分配每个基因变异可能影响人类的表型。

到目前为止,编码抽样119 1800种已知的转录的转录因子和通用组件机械有限数量的细胞类型,和13的60多个目前已知的组蛋白或DNA在147细胞类型的修改。DNase我做和广泛的RNA化验在亚细胞分离一直在进行许多细胞类型,但总体来说这些数据反映出一个小比例的潜在功能在人类基因组中编码的信息。未来一个重要的目标将是扩大这个数据集附加因素,修改和细胞,补充这一领域的其他相关项目(例如,表观基因学的项目,http://www.roadmapepigenomics.org/人类表观基因组的国际财团,http://www.ihec-epigenomes.org/)。这些项目将为人类基因组构成的基础资源,允许更深入的解释基因的组织和监管信息和监管的机制,从而为人类健康和疾病提供重要的见解。可以在线探索通过ENCODE-related联合发表论文自然编码explorer (http://www.nature.com/ENCODE),一个特别设计的可视化工具,允许用户访问相关论文和研究主题,讨论了多个文件通过主题组织的线程。

方法总结

全部细节的方法,请参阅补充信息。

引用

1
编码项目财团。编码(百科全书的DNA元素)项目。科学306年636 - 640 (2004)
- 文章
- 广告
- 中科院
- 谷歌学术搜索
2
伯尼,大肠et al。识别和分析的功能元素1%的人类基因组编码的试点项目。自然447年799 - 816 (2007)
- 文章
- 广告
- 中科院
- PubMed
- 谷歌学术搜索
3
编码项目财团。用户指南DNA序列元素的百科全书(编码)。公共科学图书馆杂志。9e1001046 (2011)
- 文章
- 中科院
- 公共医学中心
- 谷歌学术搜索
4
老鼠基因组测序协作组。初始的小鼠基因组测序和比较分析。自然420年520 - 562 (2002)
- 文章
- 中科院
- 谷歌学术搜索
5
Chiaromonte, f . et al .人类基因组DNA的分享下选择估计从human-mouse基因组比对。冷泉哈布。计算机协会。定量,杂志。68年245 - 254 (2003)
- 文章
- 中科院
- PubMed
- 谷歌学术搜索
6
库珀、通用汽车等分布和强度的约束在哺乳动物基因组序列。基因组Res。15901 - 913 (2005)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
7
帕克,s . C。汉森,L。,Abaan, H. O., Tullius, T. D. & Margulies, E. H. Local DNA topography correlates with functional noncoding regions of the human genome.科学324年389 - 392 (2009)
- 文章
- 广告
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
8
Lindblad-Toh, k等。高分辨率的地图使用29哺乳动物人类进化的约束。自然478年476 - 482 (2011)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
9
野鸡,m & Mattick j . s .提高人类序列估计的功能。基因组Res。171245 - 1253 (2007)
- 文章
- 中科院
- PubMed
- 谷歌学术搜索
10
桥,c·p & Hardison r c功能人类基因组的一部分是什么?基因组Res。211769 - 1776 (2011)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
11
就是为了,s等。广泛分布的非编码净化选择在人类基因组中。Proc。《科学。美国104年12410 - 12415 (2007)
- 文章
- 广告
- 中科院
- PubMed
- 谷歌学术搜索
12
Landt编著,s . g . et al . ChIP-seq modENCODE编码和财团所使用的指导原则和实践。基因组Res。http://dx.doi.org/10.1101/gr.136184.111(2012)
13
李,问。,Brown, J. B., Huang, H. & Bickel, P. J. Measuring reproducibility of high-throughput experiments.安。达成。统计。51752 - 1779 (2011)
- 文章
- MathSciNet
- 数学
- 谷歌学术搜索
14
哈罗,j . et al。GENCODE:人类基因组注释编码项目的引用。基因组Res。http://dx.doi.org/10.1101/gr.135350.111(2012)
15
Howald, c . et al。结合RT-PCR-seq和RNA-seq目录编码在人类基因组中基因的所有元素。基因组Res。http://dx.doi.org/10.1101/gr.134478.111(2012)
16
Djebali, s . et al .景观在人类细胞中转录。自然http://dx.doi.org/10.1038/nature11233(这个问题)
17
Derrien, t . et al。人类长非编码rna的GENCODE v7目录:分析他们的基因结构、进化,和表达式。基因组Res。http://dx.doi.org/10.1101/gr.132159.111(2012)
18
裴,b . et al . GENCODE假基因资源。基因组医学杂志。13R51 (2012)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
19
格斯坦,m . b . et al .架构来源于人类的监管网络编码数据。自然http://dx.doi.org/10.1038/nature11245(这个问题)
20.
Bickel, p . J。博伊尔,N。,Brown, J. B., Huang, H. Y. & Zhang, N. R. Subsampling methods for genomic inference.安。达成。统计。41660 - 1697 (2010)
- 文章
- MathSciNet
- 数学
- 谷歌学术搜索
21
卡普兰,t . et al .定量模型的机制,控制全基因组转录因子结合在早期的模式果蝇发展。公共科学图书馆麝猫。7e1001290 (2011)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
22
李x y . et al .染色质的作用指导广泛的可访问性,重叠的模式果蝇转录因子绑定。基因组医学杂志。12R34 (2011)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
23
Pique-Regi, r . et al .准确推断转录因子结合的DNA序列和染色质易访问性数据。基因组Res。21447 - 455 (2011)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
24
张,y et al .初级序列和表观遗传因素在活的有机体内入住率GATA1的基因组DNA。核酸Res。377024 - 7038 (2009)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
25
Neph, s . et al。人类监管词汇编码转录因子的脚印。自然http://dx.doi.org/10.1038/nature11212(这个问题)
26
Whitfield, t . w . et al .功能分析人类启动子的转录因子结合位点。基因组医学杂志。13R50 (2012)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
27
Garrard总值,d s &, w . t .核酸酶在染色质高度敏感网站。为基础。学生物化学启。57159 - 197 (1988)
- 文章
- 中科院
- PubMed
- 谷歌学术搜索
28
莫斯科f . d .染色质重塑作为指导在哺乳动物转录调控网络。j .细胞。物化学。88年684 - 694 (2003)
- 文章
- 中科院
- PubMed
- 谷歌学术搜索
29日
瑟曼,r . e . et al。访问染色质景观的人类基因组。自然http://dx.doi.org/10.1038/nature11232(这个问题)
30.
Kundaje, a . et al .无处不在的染色质环境的异质性和不对称监管元素。基因组Res。http://dx.doi.org/10.1101/gr.136366.111(2012)
31日
舒尔茨,d . C。,Ayyanathan, K., Negorev, D., Maul, G. G. & Rauscher, F. J., III SETDB1: a novel KAP-1-associated histone H3, lysine 9-specific methyltransferase that contributes to HP1-mediated silencing of euchromatic genes by KRAB zinc-finger proteins.Dev的基因。16919 - 932 (2002)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
32
Frietze, S。,O’Geen, H., Blahnik, K. R., Jin, V. X. & Farnham, P. J. ZNF274 recruits the histone methyltransferase SETDB1 to the 3′ ends of ZNF genes.《公共科学图书馆•综合》5e15082 (2010)
- 文章
- 广告
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
33
博伊尔,a . p . et al .高分辨率全基因组在活的有机体内不同的转录因子在人类细胞的碳足迹。基因组Res。21456 - 464 (2011)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
34
Hesselberth, j . r . et al .全局映射protein-DNA交互在活的有机体内通过数字基因组的碳足迹。自然方法6283 - 289 (2009)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
35
张y等。基于模型分析ChIP-Seq (mac)。基因组医学杂志。9R137 (2008)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
36
Kouzarides, t .染色质修饰和它们的功能。细胞128年693 - 705 (2007)
- 文章
- 中科院
- 谷歌学术搜索
37
李,B。,Carey, M. & Workman, J. L. The role of chromatin during transcription.细胞128年707 - 719 (2007)
- 文章
- 中科院
- PubMed
- 谷歌学术搜索
38
亲爱的,g . C。,H一个wkins, R. D. & Ren, B. Predictive chromatin signatures in the mammalian genome.嗡嗡声。摩尔,麝猫。18R195-R201 (2009)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
39
周,诉W。,Goren, A. & Bernstein, B. E. Charting histone modifications and the functional organization of mammalian genomes.自然启麝猫。12,7 - 18 (2011)
- 文章
- 中科院
- PubMed
- 谷歌学术搜索
40
恩斯特,j . et al .染色质状态的映射和分析动力学在9个人类细胞类型。自然473年43-49 (2011)
- 文章
- 广告
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
41
亲爱的,G。,Wang, W. & Ren, B. Discovery and annotation of functional chromatin signatures in the human genome.公共科学图书馆第一版。医学杂志。5e1000566 (2009)
- 文章
- 广告
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
42
球,m . p . et al。目标和公司战略揭示gene-body甲基化签名在人类细胞。生物科技自然》。27361 - 368 (2009)
- 文章
- 广告
- 中科院
- 谷歌学术搜索
43
迈斯纳,a等。公司DNA甲基化的地图多能和分化细胞。自然454年766 - 770 (2008)
- 文章
- 广告
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
44
Ogryzko, V V。,Schiltz, R. L., Russanova, V., Howard, B. H. & Nakatani, Y. The transcriptional coactivators p300 and CBP are histone acetyltransferases.细胞87年953 - 959 (1996)
- 文章
- 中科院
- 谷歌学术搜索
45
李斯特,r . et al。人类DNA methylomes基地分辨率显示广泛的外遗传性差异。自然462年315 - 322 (2009)
- 文章
- 广告
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
46
德克,j .基因调控在第三维度。科学319年1793 - 1794 (2008)
- 文章
- 广告
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
47
Dostie, j . et al .染色体构象捕获碳副本(5 c):一个大规模并行解决方案映射基因组之间的交互元素。基因组Res。161299 - 1309 (2006)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
48
Lajoie, b R。,van Berkum, N. L., Sanyal, A. & Dekker, J. My5C: web tools for chromosome conformation capture studies.自然方法6690 - 691 (2009)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
49
Sanyal,。,Lajoie, B., Jain, G. & Dekker, J. The long-range interaction landscape of gene promoters.自然http://dx.doi.org/10.1038/nature11279(这个问题)
50
Fullwood, m . j . et al。一个人类染色质interactome oestrogen-receptor-alpha-bound。自然462年58 - 64 (2009)
- 文章
- 广告
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
51
李,g . et al .广泛promoter-centered染色质交互提供一个拓扑转录调控的依据。细胞148年84 - 98 (2012)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
52
Borneman, a . r . et al .散度相关的转录因子结合位点在酵母的物种。科学317年815 - 819 (2007)
- 文章
- 广告
- 中科院
- PubMed
- 谷歌学术搜索
53
奥多姆,d . t . et al .组织转录调控人类和小鼠之间的显著差异。自然麝猫。39730 - 732 (2007)
- 文章
- 中科院
- PubMed
- 谷歌学术搜索
54
施密特,d . et al . Five-vertebrate ChIP-seq揭示转录因子的进化动态绑定。科学328年1036 - 1040 (2010)
- 文章
- 广告
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
55
从人口规模的测序人类基因组变异的地图。自然467年1061 - 1073 (2010)
56
国王,m . c & Wilson, a . c .进化在人类和黑猩猩的两个层次。科学188年107 - 116 (1975)
- 文章
- 广告
- 中科院
- PubMed
- 谷歌学术搜索
57
Spivakov, m . et al。分析转录因子结合位点的变异果蝇和人类。基因组医学杂志。13R49 (2012)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
58
Sandelin, a . et al。哺乳动物的RNA聚合酶II核心启动子:从全基因组研究的见解。自然启麝猫。8424 - 436 (2007)
- 文章
- 中科院
- PubMed
- 谷歌学术搜索
59
盾,x等。建模基因表达在各种细胞上下文中使用染色质特性。基因组医学杂志。13R53 (2012)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
60
发怒,j . T。,Plocik, A. M., Guthrie, C. & Yamamoto, K. R. Reciprocal intronic and exonic histone modification regions in humans.自然结构。摩尔。杂志。171495 - 1499 (2010)
- 文章
- 中科院
- 谷歌学术搜索
61年
Tilgner, h . et al .深度测序的亚细胞RNA分数显示拼接主要co-transcriptional在人类基因组中但lncRNAs效率低下。基因组Res。http://dx.doi.org/10.1101/gr.134445.111(2012)
62年
傅,Y。,Sinha, M., Peterson, C. L. & Weng, Z. The insulator binding protein CTCF positions 20 nucleosomes around its binding sites across the human genome.公共科学图书馆麝猫。4e1000138 (2008)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
63年
科恩伯格,r . d . &路博,l .统计分布的核小体:非随机随机位置的机制。核酸Res。166677 - 6690 (1988)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
64年
周末,d . e . et al .核小体定位在人类基因组的动态监管。细胞132年887 - 898 (2008)
- 文章
- 中科院
- PubMed
- 谷歌学术搜索
65年
Valouev, a . et al,核小体组织在人类细胞主要的决定因素。自然474年516 - 520 (2011)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
66年
Frietze, et al。细胞特定类型绑定模式显示,TCF7L2可以拴在基因组与GATA3协会。基因组医学杂志。13R52 (2012)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
67年
Yip刘贤等。人类基因组区域分类的基础上根据模拟结合位点100多transcription-related因素。基因组医学杂志。13R48 (2012)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
68年
霍夫曼,m . m . et al .无监督模式在人类发现通过基因组染色质结构分割。自然方法9473 - 476 (2012)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
69年
Kapranov, p . et al . RNA地图揭示新的RNA类和一个可能的转录功能普遍。科学316年1484 - 1488 (2007)
- 文章
- 广告
- 中科院
- PubMed
- 谷歌学术搜索
70年
科赫,f . et al .转录起始平台和GTF招聘组织增强剂和促进剂。自然结构。摩尔。杂志。18956 - 963 (2011)
- 文章
- 中科院
- 谷歌学术搜索
71年
麦克莱恩,c . y . et al .伟大的改善功能的解释基因区域。生物科技自然》。28495 - 501 (2010)
- 文章
- 中科院
- 谷歌学术搜索
72年
Rozowsky j . et al . AlleleSeq:分析allele-specific表达式和绑定在一个网络框架。摩尔。系统。医学杂志。7522 (2011)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
73年
博伊尔,a . p . et al .注释功能使用RegulomeDB个人基因组的变化。基因组Res。http://dx.doi.org/10.1101/gr.137323.112(2012)
74年
Hindorff,洛杉矶等。潜在的病原学的和功能影响人类疾病的全基因组关联位点和特征。Proc。《科学。美国106年9362 - 9367 (2009)
- 文章
- 广告
- PubMed
- 谷歌学术搜索
75年
肖布,m·A。,Boyle, A. P., Kundaje, A., Batzoglou, S. & Snyder, M. Linking disease associations with regulatory information in the human genome.基因组Res。http://dx.doi.org/10.1101/gr.136127.111(2012)
76年
Libioulle, c . et al .小说克罗恩病轨迹被全基因组关联映射到一个基因沙漠p13.1 5日和调节PTGER4的表情。公共科学图书馆麝猫。3e58 (2007)
- 文章
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
77年
Vernot et al。个人和人口基因组学人类的监管变化。基因组Res。http://dx.doi.org/10.1101/gr.134890.111(2012)
78年
Harismendy, o . et al . 9 p21基因变异与冠状动脉疾病损害interferon-γ信号响应。自然470年264 - 268 (2011)
- 文章
- 广告
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索
79年
程,et al。理解转录调控转录因子绑定数据的综合分析。基因组Res。http://dx.doi.org/10.1101/gr.136838.111(2012)
80年
舒斯特尔,s . c . et al。完成(并从南部非洲班图人的基因组。自然463年943 - 947 (2010)
- 文章
- 广告
- 中科院
- PubMed
- 公共医学中心
- 谷歌学术搜索

下载参考

确认

我们感谢我们实验室的其他成员和机构促成了这个项目的实验和分析组件。我们感谢d . Leja援助与生产数据。的财团资助NHGRI如下:生产补助:U54HG004570 (b . e . Bernstein);U01HG004695 (e .伯尼);U54HG004563 (g . e . Crawford);U54HG004557 (t . r . Gingeras);U54HG004555 (t·j·哈伯德);U41HG004568 (w·j·肯特);U54HG004576 (r . m . Myers);U54HG004558 (m . Snyder); U54HG004592 (J. A. Stamatoyannopoulos). Pilot grants: R01HG003143 (J. Dekker); RC2HG005591 and R01HG003700 (M. C. Giddings); R01HG004456-03 (Y. Ruan); U01HG004571 (S. A. Tenenbaum); U01HG004561 (Z. Weng); RC2HG005679 (K. P. White). This project was supported in part by American Recovery and Reinvestment Act (ARRA) funds from the NHGRI through grants U54HG004570, U54HG004563, U41HG004568, U54HG004592, R01HG003143, RC2HG005591, R01HG003541, U01HG004561, RC2HG005679 and R01HG003988 (L. Pennacchio). In addition, work from NHGRI Groups was supported by the Intramural Research Program of the NHGRI (L. Elnitski, ZIAHG200323; E. H. Margulies, ZIAHG200341). Research in the Pennachio laboratory was performed at Lawrence Berkeley National Laboratory and at the United States Department of Energy Joint Genome Institute, Department of Energy Contract DE-AC02-05CH11231, University of California.

作者信息

从属关系

脊椎动物基因组学,欧洲生物信息学研究所(EMBL-EBI),威康信托基金会基因组校园,Hinxton,剑桥郡CB10 1 sd,英国。
- 伊恩·邓纳姆
- ,伊万伯尼
- ,并没有
- ,史蒂文·p·怀尔德
- ,达米安Keefe
- 凯瑟琳比尔
- ,保罗Flicek
- 内森•约翰逊
- &丹尼尔Sobral
计算机科学系,318年斯坦福大学校园开车,斯坦福,加州94305 - 5428,美国。
- Anshul Kundaje
- ,Serafim Batzoglou
- Nadine Hussami
- ,索非亚Kyriazopoulou-Panagiotopoulou
- ,马克斯·w·利
- 马克·a .他
- Anshul Kundaje &
开关柜基因组学,1455年亚当斯驱动1317套房,门洛帕克,加利福尼亚州94025,美国。
- 雪莱f . Aldred
- 帕特里克j·柯林斯
- 和内森·d·Trinklein
功能基因组学,冷泉港实验室,1 Bungtown路,冷泉港,11724年纽约,美国。
- 凯莉·a . Davis
- Felix施莱辛格
- 托马斯·r·Gingeras
- ,亚历克斯·多布林
- 林,魏
- 汕头市澄海,雪
- ,克里斯·扎尔斯基
- 迈克尔·t·贝尔
- 菲利普Batut
- 贝尔,金伯利
- ,Sudipto Chakrabortty
- ,Jorg Drenkow
- ,梅根Fastuca
- ,形Fejes-Toth
- 艾瑟夫巴德戈登,
- ,Sonali Jha
- 乔纳森•b . Preall
- ,金伯利Presaud
- ,Lei-Hoon看到
- Huaien,王
- Gregory j . Hannon
- Thomas r . Gingeras &
大学ay作为纳米科学与工程学院,257年富勒,NFE 4405年,奥尔巴尼,纽约12203,美国。
- 弗朗西斯·多伊尔
- 与斯科特·a·特南鲍姆
广泛的麻省理工学院和哈佛,剑桥7中心,02142年,美国马萨诸塞州剑桥
- 查尔斯·b·爱普斯坦
- ,诺姆Shoresh
- ,布拉德利·e·伯恩斯坦
- 米凯尔森Tarjei s .
- ,阿龙征服
- Ram,奥伦
- 张,小兰
- 王,李
- ,Robbyn石头
- 迈克尔·j·科因
- 蒂莫西,达勒姆
- ,manche Ku
- & Thanh Truong
生物化学和分子生物学,南加州大学/诺里斯综合癌症中心,要人街1450号,NRT 6503年,洛杉矶,加州90089,美国。
- 赛斯Frietze
- 佩吉·j·萨利
- &希瑟·威特
信息学,维尔康姆基金会桑格研究所,威康信托基金会基因组校园,Hinxton,英国剑桥郡CB10 1 sa。
- 珍妮弗哈罗
- 蒂莫西·j·哈伯德
- Felix Kokocinski
- ,Bronwen Aken
- 丹尼尔·巴雷尔
- 吉玛Barson
- 安德鲁·贝瑞
- ,亚历山德拉Bignell
- ,Veronika Boychenko
- ,克莱尔·戴维森
- ,格洛丽亚Despacio-Reyes
- 亚当·法兰克
- 詹姆斯•吉尔伯特
- ,何塞•曼努埃尔•冈萨雷斯
- 埃德•格里菲思
- ,托比·亨特
- 迈克,凯
- 简,Loveland
- ,迪帕Manthravadi
- 乔纳森•玛吉
- ,Gaurab穆克吉
- 加里·桑德斯
- 斯蒂芬·塞尔
- 雪,凯瑟琳
- ,查理管家
- ,依勒克拉Tapanari
- ,劳伦斯Wilming
- & Amonida Zadissa
医学系医学遗传学分工,华盛顿大学,3720年第15大街NE,西雅图,华盛顿,98195年美国。
- Rajinder Kaul
博伊西州立大学艺术与科学学院,1910大学,博伊西,爱达荷州83725,美国。
- Jainab Khatun
- ,摩根·c·吉丁斯
- 约翰。“
- 布赖恩-风险&
生物化学和分子药理学、程序在系统生物学、基因功能和表达程序,马萨诸塞大学医学院种植园街364号,伍斯特,麻萨诸塞州01605,美国。
- 布莱恩·r·Lajoie
- ,阿玛蒂亚Sanyal
- 、工作德克
- & Gaurav耆那教徒的
斯坦福大学遗传学系,300年巴斯德开车,m - 344,斯坦福,加州94305 - 5120,美国。
- 斯蒂芬·Landt编著
- 迈克尔·斯奈德
- ,尼克Addleman
- 基思•赌博
- 艾伦·p·博伊尔
- 菲利普·Cayting
- 程,勇
- ,凯瑟琳伊士曼
- ,图灵Euskirchen
- ,费边Grubert
- Manoj Hariharan
- 康拉德•j . Karczewski
- 玛雅Kasowski
- 菲尔Lacroute
- 雨果,林
- ,Zhengqing欧阳
- ,Dorrelyn Patacsil
- 露西娅,拉米雷斯
- 施,Minyi
- ,泰瑞Slifer
- 吴Linfeng
- & Xinqiong杨
研究所中心系统和合成生物学,细胞和分子生物学、分子遗传学和微生物学、德克萨斯大学奥斯汀分校,1大学站A4800,奥斯汀,德克萨斯78712,美国。
- Bum-Kyu李
- ,安娜Battenhouse
- 阿卡什a Bhinge
- 刘,郑
- 瑞安,m . McDaniell
- ,Yunyun倪
- & vishwanath2004 r·艾耶
基因组HudsonAlpha生物技术研究所,601年,亨茨维尔阿拉巴马州35806,美国。
- 的卡泡利
- ,蒂莫西·e·雷迪
- ,克里斯·冈特
- 理查德•m•迈尔斯
- ,杰森·格茨
- ,e·帕特里奇
- 凯瑟琳·e·瓦利
- ,安妮塔邦萨尔
- ,Preti贾殷
- 凯文·m·保龄球
- 玛丽k .交叉
- 迈克尔·a . Muratet
- ,金伯利·m·纽贝里
- 艾米·s . Nesmith
- ,芭芭拉蒲赛
- ,斯蒂芬妮·l·帕克
- ,尼古拉斯·s·戴维斯
- 莎拉·k .草地
- ,特蕾西Eggleston
- ,j·斯科特Newberry
- 肖恩·e·利维
- & Devin m .带来厄运
生物分子科学与工程中心,加州大学圣克鲁斯,高街1156号,圣克鲁斯加州95064,美国。
- 凯特·r·罗
- ,w·詹姆斯·肯特
- 板球a斯隆
- 卡特里娜,学
- Venkat s . Malladi
- ,马修·c·黄
- 高尔特p理发师
- 梅丽莎·s .克莱因
- ,蒂莫西·r·Dreszer
- ,史蒂文·g·Heitner
- ,唐娜Karolchik
- ,凡妮莎·m·Kirkup
- ,劳伦斯·r·迈耶
- 杰弗里·c·长
- ,摩根Maddren
- 布莱恩j·兰尼
- 马克Diekhans
- 和雷切尔哈特
华盛顿大学基因组科学学系,3720年15 Ave NE,西雅图,华盛顿98195 - 5065,美国。
- 彼得Sabo
- 迈克尔·m·霍夫曼
- 罗伯特·e·瑟曼
- 丹尼尔·l·贝茨
- 加菲尔德特里萨·k .
- ,摩根j . Diegel
- 道格拉斯·邓恩
- ,艾丽卡要点
- Eric Haugen
- 理查德·亨伯特
- Audra k·约翰逊
- ,Tattyana诉Kutyavin
- ,克里斯汀李
- 马修·t·Maurano
- 肖恩·j·Neph
- 内里Fiedencio诉,
- ,Hongzhu
- ,亚历克斯·p·雷诺兹
- 蟑螂,沃恩
- Eric Rynes
- 理查德·s)
- 安东尼·o·沙佛
- Andrew b Stergachis
- ,肖恩·托马斯
- 本杰明Vernot
- ,杰夫Vierstra
- 攀爬,疯人
- 郝,王
- 莫莉a·韦弗
- ,约书亚·m·阿奇
- 迈克尔·j·MacCoss
- 威廉·斯塔福德高贵
- ,猎户座j . Buske
- & Avinash d Sahu
杜克大学基因组科学与政策研究所,101年科学驱动,达勒姆,北卡罗莱那州27708,美国。
- 阿莱克西亚萨非
- ,凌云山的歌
- 格雷戈里·e·克劳福德
- ,内森·c·谢菲尔德
- 伦敦达林
- 王,天元
- 冬天和黛博拉
生物学系,卡罗莱纳基因组科学中心和Lineberger综合癌症中心,北卡罗莱纳大学教堂山分校,408年福特汉姆大厅,教堂山,北卡罗莱纳27599 - 3280,美国。
- 杰里米·m·西蒙
- ,杰森·d·Lieb
- 琳达,l . Grasfeder
- 保罗•g . Giresi
- 金伯利淋浴,
- Christopher Shestak
- 马修·r·Schaner
- ,单独的Ki金
- 张,Zhuzhu z .
- ,乔安娜·o·Mieczkowska
- ,最小Jae金
- 亚达& Sheera
计算机科学和人工智能实验室,广泛的麻省理工学院和哈佛大学,麻省理工学院,32瓦萨尔街,剑桥,麻萨诸塞州02139,美国。
- 罗伯特·c·Altshuler
- 恩斯特,杰森
- ,Manolis >
- ,Pouya Kheradpour
- ,卢卡斯·d·沃德
- 马修·l·伊顿
- 大卫·a·亨德里克斯
- ,欧文Jungreis
- 迈克尔·f·林
- Stefan Washietl &
部门统计,加州大学伯克利分校367年埃文斯大厅,加州大学伯克利分校伯克利,加州94720,美国。
- 詹姆斯·b·布朗
- ,Qunhua李
- Peter j . Bickel
- ,Balazs Banfai
- ,内森·p·博伊尔
- 黄,海燕
- & Jingyi杰西卡·李
计算生物学和生物信息学计划,耶鲁大学,266年惠特尼大道,纽黑文,康涅狄格州06520,美国。
- 超程
- 马克·格斯坦
- ,乔尔Rozowsky
- ,凯文y Yip
- ,Alexej Abyzov
- Ekta”Khurana认为
- 静愣了
- ,Baikang裴
- Cristina Sisu
- ,罗杰·p·亚历山大
- ,雷蒙德·k·奥尔巴赫
- Balasubramanian,毒打
- ,Nitin Bhardwaj
- ,卢卡斯Habegger
- ,Arif Harmanci
- ,Renqiang最小值
- 锌锰j .μ
- ,Koon-Kiu严
- &卢卡斯Lochovsky
生物信息学和基因组学、基因调控中心(点)和UPF值,医生Aiguader, 88年,08003年巴塞罗那,西班牙加泰罗尼亚。
- 莎拉Djebali
- ,Angelika默克尔
- ,罗德里克Guigo
- ,安德里亚Tanzer
- 拉加德,朱利安
- ,迈克。罗德
- ,泰勒Alioto
- ,若昂Curado
- 托马斯·Derrien
- 佩德罗,费雷拉
- 大卫·冈萨雷斯
- 罗里约翰逊
- 科林,Kingswood
- Paolo Ribeca
- ,迈克尔Sammeth
- ,(Jorgen Skancke
- ,哈根Tilgner
- ,乔凡尼Bussotti
- Marco Mariotti
- 和塞德里克Notredame
计划在生物信息学和综合生物学、马萨诸塞大学医学院种植园街364号,伍斯特,麻萨诸塞州01605,美国。
- 文献董
- Melissa一经推出
- ,Xinying林
- 杰,王
- ,特洛伊w·维特菲尔德
- ,秦文君壮族
- &挚萍翁
遗传学、北卡罗莱纳大学教堂山分校,梅森农场路120号,7240年CB,教堂山,北卡罗莱那州27599,美国。
- 特伦斯·s·弗瑞
- & Zhancheng张
比较基因组学和生物信息学中心宾夕法尼亚州立大学,Wartik实验室,大学公园,16802年,美国宾夕法尼亚州
- 贝琳达Giardine
- ,罗斯c Hardison
- 罗伯特·s·哈里斯
- 吴,伟盛
- & Webb Miller
生物化学与分子生物学,宾夕法尼亚州立大学,304年Wartik实验室,大学公园,美国宾夕法尼亚州16802。
- 罗斯·c·Hardison
计划在生物信息学中,波士顿大学,24 Cummington街,波士顿,麻萨诸塞州02215,美国。
- Sowmya艾耶
理研组学科学中心,日本横滨研究所1-7-22 Suehiro-cho, Tsurumi-ku,神奈川230 - 0045年,日本横滨。
- Timo Lassmann
- 康复f . Abdelhamid
- 安娜玛丽亚铃木
- ,Hazuki高桥
- ,山崎
- &皮耶罗Carninci
的生物学、加州理工学院、加州156 - 291200东大道,帕萨迪纳市加州91125,美国。
- 格奥尔基k Marinov
- 芭芭拉的山地
- 布赖恩-威廉姆斯,
- ,伊戈尔Antoshechkin
- 布兰登·金
- ,洛雷恩·斯
- ,黛安娜鳟鱼
- ,Jost Vielmetter
- ,克拉克廉价香烟
- ,雪莉Pepke
- 亨利·阿大常务副校长阿姆雷恩
- 迈克尔·阿纳
- ,肯尼斯·麦丘
- 凯瑟琳。Fisher-Aylor
- ,吉尔伯托·迪沙佛
- Balasubramanian & Sreeram
中心发育和细胞生物学和复杂的生物系统,加州大学欧文分校,2218年生物科学三世,欧文,加州92697 - 2300,美国。
- 阿里Mortazavi
- &埃迪公园
基因组技术分支,国家人类基因组研究所5625渔民巷,贝塞斯达,美国马里兰州20892。
- 斯蒂芬·c·j·帕克
- 与艾略特·h·格里斯
生物化学和分子药理学、生物信息学核心,马萨诸塞大学医学院种植园街364号,伍斯特,麻萨诸塞州01605,美国。
- 美国锐意进去习
霍华德休斯医学研究所和病理学系,马萨诸塞州总医院和哈佛医学院,185年剑桥圣CPZN 8400年,波士顿,麻萨诸塞州02114,美国。
- 布拉德利·e·伯恩斯坦
- 肖恩Gillespie
- ,阿龙征服
- Ram,奥伦
- & manche Ku
国家人类基因组研究所、国立卫生研究院,31个中心,建设31日房间4 b09贝塞斯达,美国马里兰州20892 - 2152。
- 埃里克·d·绿色
国家人类基因组研究所、国家卫生研究院5635渔民巷,贝塞斯达,美国马里兰州20892 - 9307。
- 迈克尔·j·Pazin
- 丽贝卡·f . Lowdon
- 劳拉·a·l·狄龙
- ,莱斯利·b·亚当斯
- 卡罗琳·j·凯利
- 张,茱莉亚
- 朱迪丝•r . Wexler
- Peter j .好
- &伊莉斯a·法因戈尔德
儿科医学遗传学分工,杜克大学医学院的达勒姆,27710年,美国北卡罗莱纳
- 格雷戈里·e·克劳福德
国家人类基因组研究所、国家卫生研究院5625渔民巷,罗克维尔市,马里兰州20892,美国。
- 劳拉Elnitski
- 与汉娜·m·Petrykowska
Affymetrix公司,3380年中央高速公路,95051年,美国加州圣克拉拉
- Thomas r . Gingeras
Departament de不熟悉实验我de la你好,大学Pompeu布拉,巴塞罗那,08002年,西班牙加泰罗尼亚
- 罗德里克Guigo
基因组科学部门,医学系的肿瘤,355065箱,358081箱,华盛顿大学西雅图,华盛顿98195 - 5065,美国。
- John a . Stamatoyannopoulos
基因组学和系统生物学研究所,芝加哥大学东第57街900号,10100 KCBD,芝加哥,伊利诺斯州60637,美国。
- 凯文·p·白
- ,Subhradip Karmakar
- Raj r Bhanvadia
- ,爱丽娜Choudhury
- 马克•Domanus
- ,马坝
- 珍妮弗·莫兰
- 和亚历克Victorsen
贝克曼研究所,加州理工学院,加州156 - 29 1200 e .大道,帕萨迪纳市加州91125,美国。
- 芭芭拉的山地
- ,Jost Vielmetter
- ,克拉克廉价香烟
- 迈克尔·阿纳
- 凯瑟琳。Fisher-Aylor
- ,吉尔伯托·迪沙佛
- Balasubramanian & Sreeram
生物化学和生物物理学、北卡罗莱纳大学医学院校园7260箱,120梅森的农场,3010年遗传医学建筑,教堂山,北卡罗莱那州27599,美国。
- Yanbao余
- Harsha p Gunawardena
- ,希瑟·c·柯伊伯
- 克里斯托弗·w·迈尔
- 凌,谢
- 陈&西安
Centro Nacional de分析Genomico (CNAG), C / Baldiri Reixac 4,老爹我,巴塞罗那,西班牙加泰罗尼亚08028。
- 泰勒Alioto
- 科林,Kingswood
- Paolo Ribeca
- Michael Sammeth &
基因组学,Affymetrix公司,3380年中央高速公路,95051年,美国加州圣克拉拉
- 伊恩•贝尔
- ,艾丽卡杜
- ,杰基杜
- 罗陀Duttagupta,
- ,Foissac
- ,回族高
- &菲利普Kapranov
洛桑大学整合基因组学中心Genopode建筑,1015年,瑞士洛桑
- 杰奎琳一家
- ,塞德里克Howald
- ,娜塔莉·沃尔特斯
- & Alexandre Reymond
新加坡基因组技术和生物学,基因组研究所60 Biopolis街,02-01、基因组,138672年新加坡,新加坡。
- 梅丽莎·j·Fullwood
- 罗,奥斯卡j .
- ,Xiaoan阮
- 辛格Kuljeet Sandhu
- 爱,该
- 阮,皮
- ,Meizhen郑
- &平王
计算系统生物学,基因组研究所的新加坡,60 Biopolis街,02-01、基因组,138672年新加坡,新加坡。
- 郭亮李
遗传医学发展的部门,日内瓦大学医学院和日内瓦大学医院,1 Michel-Servet街,1211年瑞士日内瓦4。
- 丹尼尔Robyr
- & Stylianos大肠Antonarakis
遗传学、北卡罗莱纳大学教堂山分校5078 GMB,教堂山,北卡罗莱纳27599 - 7264,美国。
- 彼得亚雷a Mieczkowski
生物统计学、针梳全球公共卫生学院的北卡罗莱纳大学教堂山分校,408年福特汉姆大厅,教堂山,北卡罗莱纳27599 - 7445,美国。
- 纳姆,拉希德
先进的计算研究中心,加州理工学院,MC 158 - 79, 1200年东部加利福尼亚Boulavard,帕萨迪纳市加州91125,美国。
- 雪莉Pepke
部门统计,斯坦福大学,红杉大厅。390 Serra商场,斯坦福大学,94305年到4065年,加州,美国
- 翼h .黄
美国能源部联合基因组研究所,美国加州核桃溪市
- 马修·j·打击
- ,阿克塞尔Visel
- a & Len Pennachio
基因组学部门,劳伦斯伯克利国家实验室,一个回旋,女士84 - 171,伯克利,加州94720,美国。
- 阿克塞尔Visel
- a & Len Pennachio
结构计算生物学,西班牙国家癌症研究中心(CNIO) Melchor费尔南德斯Almagro, 3, 28029年马德里,西班牙。
- Iakes Ezkurdia
- 若泽•曼努埃尔•罗德里格斯
- Michael l .卷发
- &阿方索瓦伦西亚
清华大学生命科学学院,生命科学学院,清华大学,北京,100084年,中国
- 之路
病理学和实验室医学系,计算生物医学研究所,威尔康奈尔医学院,纽约大街1305号,箱140年,美国纽约,纽约,10065年。
- 安德里亚Sboner
计算机科学与工程,圣路易斯华盛顿大学,圣路易斯,密苏里州,63130年美国
- Marijke j .货车压印垫板
- 和迈克尔·布兰特
遗传学,阿尔伯特•爱因斯坦医学院的莫里斯公园大街1301号,353室,布朗克斯,10461年纽约,美国。
- 郑东新区张
生物分子科学与工程中心的霍华德•休斯医学研究所,加州大学圣克鲁斯,高街1156号,圣克鲁斯加州95064,美国。
- 大卫Haussler
基因组中心,大学戴维斯分校,451年健康科学,戴维斯,95616年,加州,美国
- 艾琳娜·r·曹
- h O 'Geen
- 和小秦许
部门的分子、细胞和发育生物学,耶鲁大学,266年惠特尼大道,纽黑文,06511年,美国康涅狄格
- 亚历山德拉的限制
- 汉娜Monahan
- ,Debasish Raha
- &布莱恩•里德
生物化学和分子药理学、哈佛医学院、洛伍德大街240号,波士顿,麻萨诸塞州02115,美国。
- 约瑟夫·d·弗莱明
- ,内森Lamarre-Vincent
- ,玛丽安Lindahl-Allen
- ,Benoit Miotto
- ,Zarmik Moqtaderi
- 和凯文Struhl
生物化学和分子生物学、南加州大学、圣巴勃罗街1501号,洛杉矶,加利福尼亚,90089年美国。
- Sushma Iyengar
俄亥俄州立大学生物医学信息学、3172 c坟墓大厅,333 W第十大道,43210年,美国俄亥俄州哥伦布市
- 维克多x金
耶鲁大学遗传学系,耶鲁大学医学院的雪松街333号,纽黑文,康涅狄格州06510,美国。
- 锦丽安
- &谢尔曼·m·斯曼
细胞和结构生物学、儿童癌症研究Institute-UTHSCSA邮件代码7784 - 7703弗洛伊德博士卷发,圣安东尼奥,德克萨斯州78229,美国。
- 路易斯o . Penalva
生物的研究中心(COS)海德堡,海德堡大学Im Neuenheimer菲尔德230年,德国海德堡69120。
- 托马斯•奥尔
- ,拉萨罗Centanin
- ,迈克尔Eichenlaub
- 调查员,Franziska Gruhl
- ,斯蒂芬Heermann
- ,Burkhard Hoeckendorf
- 井上,Daigo
- 柯尔尼,
- ,斯蒂芬Kirchmaier
- 克劳迪娅·穆勒,
- 罗伯特•莱因哈特
- ,Lea Schertel
- ,斯蒂芬妮·施耐德
- 辛恩,丽贝卡
- ,Beate Wittbrodt
- & Jochen Wittbrodt
基础科学部门,弗雷德哈钦森癌症研究中心,825年东湖牌大道东,西雅图,华盛顿,98109年美国。
- Gayathri Balasundaram
- 拜伦,瑞秋
- ,Miaohua张
- 迈克尔·本德
- &马克Groudine
医学系、医学遗传学、盒357720年,华盛顿大学西雅图,华盛顿98195 - 7720,美国。
- 阿比盖尔k·艾伯索尔
- ,特里斯坦弗拉姆
- ,r·斯科特·汉森
- 丽莎船夫
- 艾丽卡·m·约翰逊
- ,Dimitra Lotakis
- 埃里克·d·阮
- ,密涅瓦e·桑切斯
- ,Yongqi严
- 帕特里克允许
- &乔治Stamatoyannopoulos
人类生物学,弗雷德哈钦森癌症研究中心,825年东湖牌大道东,西雅图,华盛顿,98109年美国。
- 他的故事
精神病学和行为科学系的盒子356560年,华盛顿大学西雅图,华盛顿98195 - 6560,美国。
- 迈克尔·o·杜斯纳
微阵列信息集团,欧洲生物信息学研究所(EMBL-EBI),威康信托基金会基因组校园,Hinxton,剑桥郡CB10 1 sd,英国。
- 艾尔维Brazma
- & Margus Lukk
基因组学和监管系统集团,欧洲生物信息学研究所(EMBL-EBI),威康信托基金会基因组校园,Hinxton,剑桥郡CB10 1 sd,英国。
- Nicholas m . iuscombe
- &胡安·m·Vaquerizas
病理学系的遗传学,斯坦福大学,300年巴斯德开车,斯坦福,加州94305,美国。
- 。艾伦Sidow
计算机科学与工程系,185年史蒂文斯,西雅图,华盛顿,98195年美国。
- 威廉·斯塔福德高贵
电气工程系,185年华盛顿大学史蒂文斯,西雅图,华盛顿,98195年美国。
- 杰弗里·a·比尔摩斯
哈佛医学院生物医学信息学中心10 Shattuck街,波士顿,麻萨诸塞州02115,美国。
- 彼得诉Kharchenko
- Peter j .公园&
部门生物学和数学和计算机科学,埃默里大学,30322年,美国佐治亚州亚特兰大
- Anshul Kundaje
- ,达能贝克
- 与詹姆斯·泰勒

财团

编码项目财团

协调统筹协调(数据分析)
- 伊恩·邓纳姆
- &Anshul Kundaje
生产数据生产领导(数据)
- 雪莱f . Aldred
- ,帕特里克·j·柯林斯
- ,凯莉·a . Davis
- ,弗朗西斯·多伊尔
- ,查尔斯·b·爱普斯坦
- ,赛斯Frietze
- ,珍妮弗哈罗
- ,Rajinder Kaul
- ,Jainab Khatun
- ,布莱恩·r·Lajoie
- ,斯蒂芬·Landt编著
- ,Bum-Kyu李
- ,的卡泡利
- ,凯特·r·罗
- ,彼得Sabo
- ,阿莱克西亚萨非
- ,阿玛蒂亚Sanyal
- ,诺姆Shoresh
- ,杰里米·m·西蒙
- ,凌云山的歌
- &内森·d·Trinklein
导致分析师(数据分析)
- 罗伯特·c·Altshuler
- ,伊万伯尼
- ,詹姆斯·b·布朗
- ,超程
- ,莎拉Djebali
- ,文献董
- ,伊恩·邓纳姆
- ,杰森·恩斯特
- ,特伦斯·s·弗瑞
- ,马克·格斯坦
- ,贝琳达Giardine
- ,梅丽莎·格雷文写
- ,罗斯·c·Hardison
- ,罗伯特·s·哈里斯
- ,哈维亚
- ,迈克尔·m·霍夫曼
- ,Sowmya艾耶
- ,Manolis >
- ,Jainab Khatun
- ,Pouya Kheradpour
- ,Anshul Kundaje
- ,Timo Lassmann
- ,Qunhua李
- ,Xinying林
- ,格奥尔基k Marinov
- ,Angelika默克尔
- ,阿里Mortazavi
- ,斯蒂芬·c·j·帕克
- ,蒂莫西·e·雷迪
- ,乔尔Rozowsky
- ,菲利克斯•施莱辛格
- ,罗伯特·e·瑟曼
- ,洁王
- ,卢卡斯·d·沃德
- ,特洛伊w·维特菲尔德
- ,史蒂文·p·怀尔德
- ,伟盛吴
- ,美国锐意进去习
- ,凯文·y Yip
- &秦文君壮族
写作小组
- 布拉德利·e·伯恩斯坦
- ,伊万伯尼
- ,伊恩·邓纳姆
- ,埃里克·d·绿色
- ,克里斯·冈特
- &迈克尔·斯奈德
NHGRI项目管理(科学管理)
- 迈克尔·j·Pazin
- ,丽贝卡·f·Lowdon
- ,劳拉·a·l·狄龙
- ,莱斯利·b·亚当斯
- ,卡罗琳·j·凯利
- ,茱莉亚张
- ,朱迪斯·r·Wexler
- ,埃里克·d·绿色
- ,Peter j .好
- &伊莉斯a·法因戈尔德
主要调查人员(指导委员会)
- 布拉德利·e·伯恩斯坦
- ,伊万伯尼
- ,格雷戈里·e·克劳福德
- ,德克工作
- ,劳拉Elnitski
- ,佩吉·j·萨利
- ,马克·格斯坦
- ,摩根·c·吉丁斯
- ,Thomas r . Gingeras
- ,埃里克·d·绿色
- ,罗德里克Guigo
- ,罗斯·c·Hardison
- ,蒂莫西·j·哈伯德
- ,Manolis >
- ,w·詹姆斯·肯特
- ,杰森·d·Lieb
- ,艾略特·h·格里斯
- ,理查德。m .迈尔斯
- ,迈克尔·斯奈德
- ,John a . Stamatoyannopoulos
- ,斯科特·a·特南鲍姆
- ,挚萍翁
- ,凯文·p·白
- &芭芭拉的山地
博伊西州立大学和北卡罗莱纳大学教堂山分校蛋白质组学团体(数据生产和分析)
- Jainab Khatun
- ,Yanbao余
- ,约翰。“
- ,布莱恩·a .风险
- ,Harsha p Gunawardena
- ,希瑟·c·柯伊伯
- ,克里斯托弗·w·迈尔
- ,凌谢
- ,西安陈
- &摩根·c·吉丁斯
Broad研究所集团(数据生产和分析)
- 布拉德利·e·伯恩斯坦
- ,查尔斯·b·爱普斯坦
- ,诺姆Shoresh
- ,杰森·恩斯特
- ,Pouya Kheradpour
- ,米凯尔森Tarjei s .
- ,肖恩·吉莱斯皮
- ,阿龙征服
- ,奥伦Ram
- ,小兰张
- ,李王
- ,Robbyn石头
- ,迈克尔·j·科因
- ,盖达勒姆
- ,manche Ku
- ,Thanh Truong
- ,卢卡斯·d·沃德
- ,罗伯特·c·Altshuler
- ,马修·l·伊顿
- &Manolis >
冷泉港,日内瓦大学基因组中心规定,巴塞罗那,理桑格研究所,洛桑大学基因组研究所的新加坡集团(数据生产和分析)
- 莎拉Djebali
- ,凯莉·a . Davis
- ,Angelika默克尔
- ,亚历克斯·多布林
- ,Timo Lassmann
- ,阿里Mortazavi
- ,安德里亚Tanzer
- ,朱利安拉加德
- ,林小薇
- ,菲利克斯•施莱辛格
- ,汕头市澄海雪
- ,格奥尔基k Marinov
- ,Jainab Khatun
- ,布莱恩·a·威廉姆斯
- ,克里斯·扎尔斯基
- ,乔尔Rozowsky
- ,迈克。罗德
- ,Felix Kokocinski
- ,康复f . Abdelhamid
- ,泰勒Alioto
- ,Igor Antoshechkin
- ,迈克尔·t·贝尔
- ,菲利普Batut
- ,伊恩•贝尔
- ,金伯利贝尔
- ,Sudipto Chakrabortty
- ,西安陈
- ,杰奎琳一家
- ,若昂Curado
- ,托马斯Derrien
- ,Jorg Drenkow
- ,艾丽卡杜
- ,杰基杜
- ,罗陀Duttagupta
- ,梅根Fastuca
- ,型Fejes-Toth
- ,佩德罗·费雷拉
- ,Sylvain Foissac
- ,梅丽莎·j·Fullwood
- ,回族高
- ,大卫·冈萨雷斯
- ,艾瑟夫巴德戈登
- ,Harsha p Gunawardena
- ,塞德里克Howald
- ,Sonali Jha
- ,罗里约翰逊
- ,菲利普Kapranov
- ,布兰登·金
- ,科林Kingswood
- ,郭亮李
- ,奥斯卡·j·罗
- ,埃迪公园
- ,乔纳森·b·Preall
- ,金伯利Presaud
- ,保罗Ribeca
- ,布莱恩·a .风险
- ,丹尼尔Robyr
- ,Xiaoan阮
- ,迈克尔Sammeth
- ,辛格Kuljeet Sandhu
- ,洛雷恩·斯
- ,Lei-Hoon看到
- ,爱该
- ,(Jorgen Skancke
- ,安娜玛利亚铃木
- ,Hazuki高桥
- ,哈根Tilgner
- ,黛安娜鳟鱼
- ,娜塔莉·沃尔特斯
- ,Huaien王
- ,约翰。“
- ,Yanbao余
- ,山崎
- ,珍妮弗哈罗
- ,马克·格斯坦
- ,蒂莫西·j·哈伯德
- ,亚历山大Reymond
- ,Stylianos大肠Antonarakis
- ,Gregory j . Hannon
- ,摩根·c·吉丁斯
- ,怡君阮
- ,芭芭拉的山地
- ,皮耶罗Carninci
- ,罗德里克Guigo
- &Thomas r . Gingeras
加州大学圣塔克鲁兹分校数据协调中心(生产数据协调)
- 凯特·r·罗
- ,板球a·斯隆
- ,卡特里娜飓风了
- ,Venkat s Malladi
- ,马修·c·黄
- ,高尔特p理发师
- ,梅丽莎·s·克莱因
- ,蒂莫西·r·Dreszer
- ,斯蒂文Heitner
- ,唐娜Karolchik
- ,w·詹姆斯·肯特
- ,凡妮莎·m·Kirkup
- ,劳伦斯·r·迈耶
- ,杰弗里·c·长
- ,摩根Maddren
- &布莱恩·j·兰尼
EBI杜克大学,德克萨斯大学奥斯汀,北卡大学教堂山集团(数据生产和分析)
- 特伦斯·s·弗瑞
- ,凌云山的歌
- ,琳达·l·Grasfeder
- ,保罗·g·Giresi
- ,Bum-Kyu李
- ,安娜Battenhouse
- ,内森·c·谢菲尔德
- ,杰里米·m·西蒙
- ,金伯利淋浴
- ,阿莱克西亚萨非
- ,达林在伦敦
- ,阿卡什a Bhinge
- ,克里斯托弗Shestak
- ,马修·r·Schaner
- ,单独的Ki金
- ,Zhuzhu >
- ,彼得亚雷a Mieczkowski
- ,乔安娜·o·Mieczkowska
- ,郑刘
- ,瑞安·m·McDaniell
- ,Yunyun倪
- ,纳姆,拉希德
- ,分钟Jae金
- ,Sheera阿达尔月
- ,Zhancheng张
- ,天元王
- ,黛博拉的冬天
- ,Damian Keefe
- ,伊万伯尼
- ,vishwanath2004 r·艾耶
- ,杰森·d·Lieb
- &格雷戈里·e·克劳福德
新加坡集团的基因组研究所(数据生产和分析)
- 郭亮李
- ,辛格Kuljeet Sandhu
- ,Meizhen郑
- ,平王
- ,奥斯卡·j·罗
- ,爱该
- ,梅丽莎·j·Fullwood
- ,Xiaoan阮
- &怡君阮
HudsonAlpha研究所,加州理工学院、加州大学欧文分校、斯坦福集团(数据生产和分析)
- 理查德。m .迈尔斯
- ,的卡泡利
- ,布莱恩·a·威廉姆斯
- ,杰森·格茨
- ,格奥尔基k Marinov
- ,蒂莫西·e·雷迪
- ,Jost Vielmetter
- ,e·帕特里奇
- ,黛安娜鳟鱼
- ,凯瑟琳·e·瓦利
- ,克拉克廉价香烟
- ,安妮塔·邦萨尔
- ,雪莉Pepke
- ,Preti耆那教徒的
- ,亨利·阿大常务副校长阿姆雷恩
- ,凯文·m·保龄球
- ,迈克尔·阿纳
- ,玛丽k .交叉
- ,布兰登·金
- ,Michael a . Muratet
- ,Igor Antoshechkin
- ,金伯利·m·纽贝里
- ,肯尼斯·麦丘
- ,艾米s Nesmith
- ,凯瑟琳。Fisher-Aylor
- ,芭芭拉蒲赛
- ,吉尔博托迪沙佛
- ,斯蒂芬妮·l·帕克
- ,Balasubramanian Sreeram
- ,尼古拉斯·s·戴维斯
- ,莎拉·k·梅多斯
- ,特蕾西Eggleston
- ,克里斯·冈特
- ,j·斯科特·纽贝里
- ,肖恩·e·利维
- ,德文·m·带来厄运
- ,阿里Mortazavi
- ,翼h .黄
- &芭芭拉的山地
劳伦斯伯克利国家实验室组(有针对性的实验验证)
- 马修·j·打击
- ,阿克塞尔Visel
- &Len a Pennachio
NHGRI组(数据生产和分析)
- 劳拉Elnitski
- ,艾略特·h·格里斯
- ,斯蒂芬·c·j·帕克
- &汉娜·m·Petrykowska
桑格研究所,华盛顿大学,耶鲁大学基因组中心规定,巴塞罗那,加州大学,麻省理工学院,洛桑大学CNIO集团(数据生产和分析)
- Alexej Abyzov
- ,Bronwen Aken
- ,丹尼尔·巴雷尔
- ,吉玛Barson
- ,安德鲁·贝瑞
- ,亚历山德拉Bignell
- ,Veronika Boychenko
- ,乔凡尼Bussotti
- ,杰奎琳一家
- ,克莱尔·戴维森
- ,托马斯Derrien
- ,格洛丽亚Despacio-Reyes
- ,马克Diekhans
- ,Iakes Ezkurdia
- ,亚当·法兰克
- ,詹姆斯•吉尔伯特
- ,何塞•曼努埃尔•冈萨雷斯
- ,埃德•格里菲思
- ,雷切尔哈特
- ,大卫·a·亨德里克斯
- ,塞德里克Howald
- ,托比狩猎
- ,欧文Jungreis
- ,迈克·凯
- ,khuran Ekta”
- ,Felix Kokocinski
- ,京愣
- ,迈克尔·f·林
- ,简Loveland
- ,之路
- ,Deepa Manthravadi
- ,马可Mariotti
- ,乔纳森·玛吉
- ,Gaurab穆克吉
- ,塞德里克Notredame
- ,Baikang裴
- ,若泽•曼努埃尔•罗德里格斯
- ,加里·桑德斯
- ,安德里亚Sboner
- ,斯蒂芬·塞尔
- ,克里斯蒂娜Sisu
- ,凯瑟琳雪
- ,查理管家
- ,安德里亚Tanzer
- ,依勒克拉Tapanari
- ,Michael l .卷发
- ,Marijke j .货车压印垫板
- ,娜塔莉·沃尔特斯
- ,Stefan Washietl
- ,劳伦斯Wilming
- ,Amonida Zadissa
- ,郑东新区张
- ,迈克尔·布兰特
- ,大卫Haussler
- ,Manolis >
- ,阿方索瓦伦西亚
- ,马克·格斯坦
- ,亚历山大Reymond
- ,罗德里克Guigo
- ,珍妮弗哈罗
- &蒂莫西·j·哈伯德
Stanford-Yale,哈佛、麻省大学医学院、南加州大学、加州大学戴维斯分校集团(数据生产和分析)
- 斯蒂芬·Landt编著
- ,赛斯Frietze
- ,Alexej Abyzov
- ,尼克Addleman
- ,罗杰·p·亚历山大
- ,雷蒙德·k·奥尔巴赫
- ,Balasubramanian毒打
- ,基斯赌博
- ,Nitin Bhardwaj
- ,艾伦·p·博伊尔
- ,艾琳娜·r·曹
- ,菲利普Cayting
- ,亚历山德拉的限制
- ,永程
- ,超程
- ,凯瑟琳伊士曼
- ,图灵Euskirchen
- ,约瑟夫·d·弗莱明
- ,费边Grubert
- ,卢卡斯Habegger
- ,Manoj Hariharan
- ,Arif Harmanci
- ,Sushma Iyengar
- ,维克多x金
- ,康拉德·j·Karczewski
- ,玛雅Kasowski
- ,菲尔Lacroute
- ,雨果林
- ,内森Lamarre-Vincent
- ,京愣
- ,锦丽安
- ,玛丽安Lindahl-Allen
- ,Renqiang敏
- ,Benoit Miotto
- ,汉娜说
- ,Zarmik Moqtaderi
- ,锌锰j .μ
- ,O h 'Geen
- ,Zhengqing欧阳
- ,Dorrelyn Patacsil
- ,Baikang裴
- ,Debasish Raha
- ,露西娅拉米雷斯
- ,布莱恩•里德
- ,乔尔Rozowsky
- ,安德里亚Sboner
- ,Minyi史
- ,克里斯蒂娜Sisu
- ,泰瑞Slifer
- ,希瑟·威特
- ,Linfeng吴
- ,小秦许
- ,Koon-Kiu严
- ,Xinqiong杨
- ,凯文·y Yip
- ,郑东新区张
- ,凯文Struhl
- ,谢尔曼·m·斯曼
- ,马克·格斯坦
- ,佩吉·j·萨利
- &迈克尔·斯奈德
纽约州立大学奥尔巴尼大学组(数据生产和分析)
- 斯科特·a·特南鲍姆
- ,路易斯o . Penalva
- &弗朗西斯·多伊尔
芝加哥大学斯坦福集团(数据生产和分析)
- Subhradip Karmakar
- ,斯蒂芬·Landt编著
- ,Raj r . Bhanvadia
- ,Alina Choudhury
- ,Marc Domanus
- ,马坝
- ,詹妮弗·莫兰
- ,Dorrelyn Patacsil
- ,泰瑞Slifer
- ,亚历克Victorsen
- ,Xinqiong杨
- ,迈克尔·斯奈德
- &凯文·p·白
海德堡大学组(有针对性的实验验证)
- 托马斯•奥尔
- ,拉萨罗Centanin
- ,迈克尔Eichenlaub
- ,调查员Franziska Gruhl
- ,Stephan Heermann
- ,伯克哈德Hoeckendorf
- ,Daigo井上
- ,柯尔尼挚友
- ,Stephan Kirchmaier
- ,克劳迪娅·穆勒
- ,罗伯特•莱因哈特
- ,Lea Schertel
- ,斯蒂芬妮·施耐德
- ,丽贝卡Sinn
- ,Beate Wittbrodt
- &Jochen Wittbrodt
马萨诸塞大学医学院生物信息学小组(数据生产和分析)
- 挚萍翁
- ,特洛伊w·维特菲尔德
- ,洁王
- ,帕特里克·j·柯林斯
- ,雪莱f . Aldred
- ,内森·d·Trinklein
- ,e·克里斯托弗·帕特里奇
- &理查德。m .迈尔斯
马萨诸塞大学医学院基因组折叠组(数据生产和分析)
- 德克工作
- ,Gaurav耆那教徒的
- ,布莱恩·r·Lajoie
- &阿玛蒂亚Sanyal
华盛顿大学,麻萨诸塞州大学医学中心集团(数据生产和分析)
- Gayathri Balasundaram
- ,丹尼尔·l·贝茨
- ,瑞秋拜伦
- ,特里萨·k·坎菲尔德
- ,摩根j . Diegel
- ,道格拉斯·邓恩
- ,阿比盖尔k·艾伯索尔
- ,特里斯坦弗拉姆
- ,他的故事
- ,艾丽卡要点
- ,r·斯科特·汉森
- ,丽莎船夫
- ,Eric Haugen
- ,理查德·亨伯特
- ,Gaurav耆那教徒的
- ,Audra k·约翰逊
- ,艾丽卡·m·约翰逊
- ,Tattyana诉Kutyavin
- ,布莱恩·r·Lajoie
- ,克里斯汀·李
- ,Dimitra Lotakis
- ,马修·t·Maurano
- ,肖恩·j·Neph
- ,Fiedencio诉内里
- ,埃里克·d·阮
- ,瞿Hongzhu
- ,亚历克斯·p·雷诺兹
- ,沃恩罗奇
- ,Eric Rynes
- ,彼得Sabo
- ,密涅瓦e·桑切斯
- ,理查德·s)
- ,阿玛蒂亚Sanyal
- ,安东尼·o·沙佛
- ,安德鲁·b·Stergachis
- ,肖恩·托马斯。
- ,罗伯特·e·瑟曼
- ,本杰明Vernot
- ,杰夫Vierstra
- ,攀爬疯人
- ,郝王
- ,莫莉a·韦弗
- ,Yongqi严
- ,Miaohua张
- ,约书亚·m·阿奇
- ,迈克尔·本德
- ,迈克尔·o·杜斯纳
- ,马克Groudine
- ,迈克尔·j·MacCoss
- ,帕特里克允许
- ,乔治Stamatoyannopoulos
- ,Rajinder Kaul
- ,德克工作
- &John a . Stamatoyannopoulos
数据分析中心(数据分析)
- 伊恩·邓纳姆
- ,凯瑟琳·比尔
- ,艾尔维Brazma
- ,保罗Flicek
- ,哈维亚
- ,内森•约翰逊
- ,Damian Keefe
- ,Margus Lukk
- ,Nicholas m . iuscombe
- ,丹尼尔Sobral
- ,胡安·m·Vaquerizas
- ,史蒂文·p·怀尔德
- ,Serafim Batzoglou
- ,。艾伦Sidow
- ,Nadine Hussami
- ,索非亚Kyriazopoulou-Panagiotopoulou
- ,马克斯·w·利
- ,马克·a·肖布
- ,Anshul Kundaje
- ,罗斯·c·Hardison
- ,韦伯米勒
- ,贝琳达Giardine
- ,罗伯特·s·哈里斯
- ,伟盛吴
- ,Peter j . Bickel
- ,Balazs Banfai
- ,内森·p·博伊尔
- ,詹姆斯·b·布朗
- ,海盐黄
- ,Qunhua李
- ,精益杰西卡·李
- ,威廉·斯塔福德高贵
- ,杰弗里·a·比尔摩斯
- ,猎户座j . Buske
- ,迈克尔·m·霍夫曼
- ,Avinash d Sahu
- ,彼得诉Kharchenko
- ,Peter j .公园
- ,达能贝克
- ,詹姆斯·泰勒
- ,挚萍翁
- ,Sowmya艾耶
- ,文献董
- ,梅丽莎·格雷文写
- ,Xinying林
- ,洁王
- ,美国锐意进去习
- ,秦文君壮族
- ,马克·格斯坦
- ,罗杰·p·亚历山大
- ,Balasubramanian毒打
- ,超程
- ,Arif Harmanci
- ,卢卡斯Lochovsky
- ,Renqiang敏
- ,锌锰j .μ
- ,乔尔Rozowsky
- ,Koon-Kiu严
- ,凯文·y Yip
- &伊万伯尼

贡献

有关详细信息,请参阅该财团作者列表的作者的贡献。

相应的作者

对应到伊万伯尼。

道德声明

相互竞争的利益

作者声明没有竞争的经济利益。

权利和权限

本文根据分布Creative Commons Attribution-Non-Commercial-Share都许可证(http://creativecommons.org/licenses/by-nc-sa/3.0/)。

再版和权限

关于这篇文章

引用这篇文章

邓纳姆,我。,Kundaje, A., Aldred, S.et al。一个集成的百科全书在人类基因组中DNA的元素。自然489年,57 - 74 (2012)。https://doi.org/10.1038/nature11247

下载引用

收到了:2011年11月24日
接受:2012年5月29日
发表:2012年9月05
发行日期:2012年9月06
DOI:https://doi.org/10.1038/nature11247

进一步的阅读

针对异常的RAS /皇家空军/ MEK / ERK信号对癌症治疗
- Ufuk Degirmenci
- ,王美
- &建成胡
细胞(2020)
微rna - 425 - 5 - p抑制肺癌细胞生长在体外和体内的表达下调TFIIB-Related因素2
- 西域
- ,香港郑
- ,Rongfei太阳
- ,Xuejiao钱
- ,萍江
- ,博杨
- ,Jiangbo刘
- &小平李
技术在癌症研究和治疗(2020)
临床意义的原发性开角型青光眼遗传学的最新进展
- 海琳·曲克
- ,詹尼l . Wiggs
- &安东尼·p·主席
眼睛(2020)
细胞分化:50年来我们学到了什么?
- 斯图亚特·a·纽曼
理论生物学杂志》上(2020)
大麻素CB2受体转录因子NRF2特定调制的小胶质细胞
- m . Galan-Ganga
- ,r·德尔里奥
- ,n Jimenez-Moreno
- ,m . Diaz-Guerra
- &即Lastres-Becker
细胞和分子神经生物学(2020)

通过提交评论你同意遵守我们的条款和社区指导原则。如果你发现一些滥用或不符合我们的条件或准则请国旗是不合适的。

主题

文摘

主要

编码数据生产和初步分析

集成方法

转录和蛋白质编码区域

核糖核酸

蛋白结合的区域

DNase我过敏的网站和脚印

区域组蛋白修饰

DNA甲基化

Chromosome-interacting地区

总结ENCODE-identified元素

选择的功能元素的影响

编码数据集成与已知的基因特性

Promoter-anchored集成

Transcription-factor-binding site-anchored集成

转录因子co-associations

全基因组整合

洞察人类基因组变异

罕见变异,个人基因组和体细胞变异

常见变异与疾病有关

结束语

方法总结

引用

确认

作者信息

从属关系

财团

编码项目财团

协调统筹协调(数据分析)

生产数据生产领导(数据)

导致分析师(数据分析)

写作小组

NHGRI项目管理(科学管理)

主要调查人员(指导委员会)

博伊西州立大学和北卡罗莱纳大学教堂山分校蛋白质组学团体(数据生产和分析)

Broad研究所集团(数据生产和分析)

冷泉港,日内瓦大学基因组中心规定,巴塞罗那,理桑格研究所,洛桑大学基因组研究所的新加坡集团(数据生产和分析)

加州大学圣塔克鲁兹分校数据协调中心(生产数据协调)

EBI杜克大学,德克萨斯大学奥斯汀,北卡大学教堂山集团(数据生产和分析)

新加坡集团的基因组研究所(数据生产和分析)

HudsonAlpha研究所,加州理工学院、加州大学欧文分校、斯坦福集团(数据生产和分析)

劳伦斯伯克利国家实验室组(有针对性的实验验证)

NHGRI组(数据生产和分析)

桑格研究所,华盛顿大学,耶鲁大学基因组中心规定,巴塞罗那,加州大学,麻省理工学院,洛桑大学CNIO集团(数据生产和分析)

Stanford-Yale,哈佛、麻省大学医学院、南加州大学、加州大学戴维斯分校集团(数据生产和分析)

纽约州立大学奥尔巴尼大学组(数据生产和分析)

芝加哥大学斯坦福集团(数据生产和分析)

海德堡大学组(有针对性的实验验证)

马萨诸塞大学医学院生物信息学小组(数据生产和分析)

马萨诸塞大学医学院基因组折叠组(数据生产和分析)

华盛顿大学,麻萨诸塞州大学医学中心集团(数据生产和分析)

数据分析中心(数据分析)

贡献

相应的作者

道德声明

相互竞争的利益

补充信息

幻灯片

权利和权限

关于这篇文章

引用这篇文章

进一步的阅读

评论

搜索

快速链接