摘要

比较毒理学基因组学数据库(CTD;http://ctdbase.org/)提供化学物质和基因产物之间相互作用的信息,以及它们与疾病的关系。核心CTD内容(化学-基因、化学-疾病和基因-疾病相互作用,从文献中手动策划)彼此集成,并与选择的外部数据集集成,以生成扩展的网络和预测新的关联。今天,核心CTD包括超过3050万个毒性基因组连接,涉及化学物质/药物、基因/蛋白质、疾病、分类群、基因本体(GO)注释、途径和基因相互作用模块。在这次更新中,我们报告了自2015年以来核心数据内容增加了33%,描述了我们的新暴露模块(将暴露科学信息与核心毒理学基因组数据协调起来),并介绍了一个新的氧化石墨烯疾病推断数据集(确定看似不相关的病理的共同分子基础)。这些进展将现实世界中的化学暴露与分子途径集中起来并置于背景中,以帮助科学家提出可测试的假设,以努力了解受环境影响的疾病的病因和机制。

介绍

比较毒理学基因组学数据库(CTD;http://ctdbase.org)是毒理学基因组信息的公共资源,由同行评议的科学文献手工整理,提供有关环境化学物质与基因产物的相互作用及其对人类疾病影响的关键信息(1- - - - - -4).CTD由专业生物馆长策划,他们利用受控词汇、本体和结构化符号来编码描述化学-基因、化学-疾病和基因-疾病关系的核心相互作用的三元组(5),然后在内部集成,以生成推断的化学-基因疾病网络。这些数据进一步与外部数据集相关联,以在不同类型的信息之间建立新颖的、统计上排名的推论(6- - - - - -7).此外,作为我们与科学界持续积极接触的一部分,CTD在推进生物医学信息的文本挖掘方法方面发挥着重要作用,作为BioCreative联盟(8- - - - - -12),促进环境健康科学界制定语义标准(13),以符合生物共享资讯资源(14),并已成为注册会员(https://biosharing.org/biodbcore-000173) (15).

在此,我们提供两年一次的数据库更新,最值得注意的是强调我们新发布的暴露科学模块,该模块将化学暴露数据协调并整合到CTD更广泛的生物框架中(16).暴露科学在评估实验毒性数据、开展风险评估和为公共卫生政策提供信息方面发挥着重要作用(17).集中人体暴露信息对于评估“暴露量”至关重要,“暴露量”定义为个人自出生以来暴露量的累积测量(18).此外,暴露体通过记录和测量环境成分来补充基因组研究,环境成分与基因相互作用以确定一个人的表型(18).CTD的新暴露科学模块为研究人员提供了一个集中资源,用于将真实环境化学测量结果与实验室衍生的毒性基因组数据联系起来。这一新功能,以及本文描述的其他更新,进一步扩大了CTD在环境健康研究中的效用。

新功能

增加科学界的数据内容、传播和使用

2016年7月,核心CTD由超过160万人工策划的相互作用(包括1 379 105种化学物质-基因,202 085种化学物质-疾病和33 583种基因-疾病直接相互作用)组成,涉及14 672种化学物质,42 761种基因和6401种疾病,这些疾病来自对564个物种进行研究的117 866篇同行评审的科学文章(表2)1).自上次更新以来,化学-基因-疾病相互作用增加了33% (4).CTD还集成了手动筛选的数据,以生成预测推断(67);例如,如果化学物质A与基因B相互作用,且独立的基因B与疾病C相关,则推断化学物质A与疾病C相关(通过基因B)。内部整合核心数据产生了1970多万条基因-疾病关系推断和180万条化学物质-疾病关系推断,其统计排名为(7).最后,与来自GO (19), kegg (20.)、反应组(21)及生物网格(22)会产生额外的推断关系(表1).总共有超过3050万个毒理基因组连接可免费用于分析和假设发展。

更新CTD核心内容(2016年7月)

表1。
更新CTD核心内容(2016年7月)
数据类型 计数
人工管理 科学论文 117 866
人工管理 化学物质 672年14
人工管理 基因 42 761
人工管理 疾病 6401
人工管理 分类单元 561
人工管理 Chemical-gene交互 1 379 105
人工管理 基因-疾病的相互作用 33 583
人工管理 Chemical-disease交互 202 085
数据集成 基因-疾病的推论 19 720 041
数据集成 Chemical-disease推论 1 858286
数据集成 Chemical-GO推论 4 529 027
数据集成 化学途径的推论 307 728
数据集成 Disease-pathway推论 59岁863
数据集成 疾病是推论 795 845
进口 Gene-GO注释 1 201 527
进口 基因的路径注释 63 863
进口 基因基因相互作用 376 472
总计 30 527 425
数据类型 计数
人工管理 科学论文 117 866
人工管理 化学物质 672年14
人工管理 基因 42 761
人工管理 疾病 6401
人工管理 分类单元 561
人工管理 Chemical-gene交互 1 379 105
人工管理 基因-疾病的相互作用 33 583
人工管理 Chemical-disease交互 202 085
数据集成 基因-疾病的推论 19 720 041
数据集成 Chemical-disease推论 1 858286
数据集成 Chemical-GO推论 4 529 027
数据集成 化学途径的推论 307 728
数据集成 Disease-pathway推论 59岁863
数据集成 疾病是推论 795 845
进口 Gene-GO注释 1 201 527
进口 基因的路径注释 63 863
进口 基因基因相互作用 376 472
总计 30 527 425
表1。
更新CTD核心内容(2016年7月)
数据类型 计数
人工管理 科学论文 117 866
人工管理 化学物质 672年14
人工管理 基因 42 761
人工管理 疾病 6401
人工管理 分类单元 561
人工管理 Chemical-gene交互 1 379 105
人工管理 基因-疾病的相互作用 33 583
人工管理 Chemical-disease交互 202 085
数据集成 基因-疾病的推论 19 720 041
数据集成 Chemical-disease推论 1 858286
数据集成 Chemical-GO推论 4 529 027
数据集成 化学途径的推论 307 728
数据集成 Disease-pathway推论 59岁863
数据集成 疾病是推论 795 845
进口 Gene-GO注释 1 201 527
进口 基因的路径注释 63 863
进口 基因基因相互作用 376 472
总计 30 527 425
数据类型 计数
人工管理 科学论文 117 866
人工管理 化学物质 672年14
人工管理 基因 42 761
人工管理 疾病 6401
人工管理 分类单元 561
人工管理 Chemical-gene交互 1 379 105
人工管理 基因-疾病的相互作用 33 583
人工管理 Chemical-disease交互 202 085
数据集成 基因-疾病的推论 19 720 041
数据集成 Chemical-disease推论 1 858286
数据集成 Chemical-GO推论 4 529 027
数据集成 化学途径的推论 307 728
数据集成 Disease-pathway推论 59岁863
数据集成 疾病是推论 795 845
进口 Gene-GO注释 1 201 527
进口 基因的路径注释 63 863
进口 基因基因相互作用 376 472
总计 30 527 425

除了我们自己的公共web应用程序(PWA)之外,CTD研究和策划的内容还以许多重要的方式进一步传播到科学界。首先,至少有72个外部资源现在包括并显示CTD信息作为其自己数据库的一部分,比我们上次报告的50个来源增加了44% (http://ctdbase.org/about/publications/#use).其次,我们与辉瑞科学家合作开发了ToxEvaluator,这是一种专有工具,它将CTD化学-基因-疾病关系与其他不同的(公共和私人)数据集集成到一个单一的基于网络的平台中,以帮助辉瑞科学家产生与毒性相关的机制假设(23).最后,CTD继续致力于为科学界先锋和推进生物医学文本挖掘研究,与国家生物技术信息中心(NCBI)合作,组织生物创意社区挑战,重点是开发识别和提取特定疾病和化学成分的工具(11).为此,我们帮助从1500篇PubMed文章(12);本语料库免费提供(可点击下载:http://sourceforge.net/projects/bioc/files/CDR_Data.zip/download),以及由25个参与团队开发的许多相关文本挖掘工具。

新的CTD曝光科学模块

最值得注意的是,自从我们上次更新以来,CTD已经发布了一个新的曝光模块(16).该组件是为了响应社区对一个集中数据库的需求而开发的,该数据库可以管理和协调环境化学品(例如空气污染物、农药、重金属、多氯联苯、在其他事物之外)和人体生物标记物。

与曝光科学界合作,CTD开发了一种新颖的手动策展范式(16),使用公开本体作为基础(24).在这个模块中,CTD生物馆长将超过35个数据字段注释为四个主要类别,这些类别共同形成了一个风险声明.一个陈述是关于如何接触压力与人类互动风险受体在一次曝光事件导致…接触的结果(图1).这种管理范式的一个整体特征是,我们在管理核心CTD的化学-基因-疾病相互作用时使用许多相同的受控词汇表(516).因此,被描述为暴露应激源或事件生物标志物的化学物质用CTD的化学词汇进行注释;同样,蛋白质生物标志物(如血清蛋白、细胞因子、白细胞介素)使用CTD的基因词汇表进行编码;暴露结果被注释为CTD的MEDIC疾病词汇表(25)或GO生物过程(GO- bp)术语用于表型,我们之前将其定义为“非疾病术语生物事件”(26).这种管理策略提供了三个重要的优势。首先,它允许不同实验室几十年来在不同期刊上发表的不同文章的异构暴露信息标准化并集中到一个单一的存储库中,促进独特研究之间的联系。其次,它将暴露科学数据纳入更广泛的CTD框架,允许暴露数据利用CTD策划的知识,也允许核心CTD帮助为暴露分析提供信息。最后,使用受控词汇表将复杂的、相互依赖的暴露事件转换为模块化数据,允许从各种角度(如地理位置和受体类型)对暴露信息进行排序、过滤和查看。

图1所示。

将暴露数据管理集成到CTD框架中。核心CTD由化学物质、基因、疾病、基因本体(GO)术语和通路注释(上图中彩色圈)之间的相互作用组成。2015年3月,CTD发布了一个曝光科学模块(上图中浅橙色圆圈)。对于这个范例,CTD手动组织暴露陈述(底部浅蓝色框,浅橙色类别由黑线连接),描述环境压力源在暴露事件中如何与人体受体相互作用,从而导致暴露结果。这个管理范式使用了许多与核心CTD中使用的相同的受控词汇表,以实现两个项目之间的无缝数据集成和连接:暴露压力源是化学物质(蓝色箭头);暴露事件报告化学物质(蓝色箭头)和蛋白质(绿色箭头)的生物标志物测量;暴露结果可以改变表型(定义为GO术语,灰色箭头)或疾病(红色箭头)。

图1所示。

将暴露数据管理集成到CTD框架中。核心CTD由化学物质、基因、疾病、基因本体(GO)术语和通路注释(上图中彩色圈)之间的相互作用组成。2015年3月,CTD发布了一个曝光科学模块(上图中浅橙色圆圈)。对于这个范例,CTD手动组织暴露陈述(底部浅蓝色框,浅橙色类别由黑线连接),描述环境压力源在暴露事件中如何与人体受体相互作用,从而导致暴露结果。这个管理范式使用了许多与核心CTD中使用的相同的受控词汇表,以实现两个项目之间的无缝数据集成和连接:暴露压力源是化学物质(蓝色箭头);暴露事件报告化学物质(蓝色箭头)和蛋白质(绿色箭头)的生物标志物测量;暴露结果可以改变表型(定义为GO术语,灰色箭头)或疾病(红色箭头)。

手动整理的暴露数据显示在CTD PWA的两个新选项卡上:“暴露研究”(提供每篇暴露文章的摘要)和“暴露细节”(提供详细的生物标志物测量),位于所有相关的化学、基因、疾病、GO和参考文献页面。此外,调查人员可以使用CTD的新暴露研究查询页面(http://ctdbase.org/query.go?type=expStudies)以快速检索在研究(研究文章)级别聚合的信息(图2),使用化学压力源(如“空气污染物”)、所研究的人体受体类型(如“研究对象”)和地理位置(如“美国”)的参数。结果页面中返回的选定术语(化学品、基因、疾病、GO和参考文献)超链接到CTD中相应的页面(图2 b),允许用户无缝地浏览其他相关信息。

图2。

CTD全新的曝光策划内容。(一个) CTD全新的“辐射研究”查询网页(http://ctdbase.org/query.go?type=expStudies)允许用户使用各种搜索参数检索研究信息,包括暴露化学压力源(如空气污染物,蓝色圆圈)、受体描述(如研究对象)和国家(如美国)作为研究地点(蓝色箭头)。(B)结果显示了符合查询参数(黄色突出显示)的筛选暴露研究,并集成了任何提到的基因、化学物质、疾病、表型(GO-BP术语)和来源参考文献(蓝色虚线框,橙色标注标签)的链接。“作者摘要”一栏提供了每项研究的要点,“测量”一栏中的“详细信息”链接将用户带到具体的测定方法。同样,所有暴露内容都在上述页面上相互显示(即基因、化学、疾病、表型和来源参考),使信息无缝地集成到CTD框架的更广泛的生物学背景中。(C截至2016年7月,CTD暴露模块的数据状态包括来自1250多篇参考文献的70600多份手动整理报表(每月更新于:http://ctdbase.org/about/dataStatus.go).

图2。

CTD全新的曝光策划内容。(一个) CTD全新的“辐射研究”查询网页(http://ctdbase.org/query.go?type=expStudies)允许用户使用各种搜索参数检索研究信息,包括暴露化学压力源(如空气污染物,蓝色圆圈)、受体描述(如研究对象)和国家(如美国)作为研究地点(蓝色箭头)。(B)结果显示了符合查询参数(黄色突出显示)的筛选暴露研究,并集成了任何提到的基因、化学物质、疾病、表型(GO-BP术语)和来源参考文献(蓝色虚线框,橙色标注标签)的链接。“作者摘要”一栏提供了每项研究的要点,“测量”一栏中的“详细信息”链接将用户带到具体的测定方法。同样,所有暴露内容都在上述页面上相互显示(即基因、化学、疾病、表型和来源参考),使信息无缝地集成到CTD框架的更广泛的生物学背景中。(C截至2016年7月,CTD暴露模块的数据状态包括来自1250多篇参考文献的70600多份手动整理报表(每月更新于:http://ctdbase.org/about/dataStatus.go).

暴露生物标记物的真实测量结果可在“暴露研究”页面的“详细信息”链接下找到,也可查看在托托在感兴趣的化学品的“暴露细节”数据选项卡上(图3.).后一种方法汇总CTD中相关文章的数据,为用户提供已发表文献中暴露测量和结果的全景视图。此外,“曝光详情”查询页面也可用(http://ctdbase.org/query.go?type=expDetails)以检索高粒度公开语句级别的记录。

图3。

为曝光科学策划的真实世界测量和结果的景观视图。CTD空气污染物化学页面上的“暴露详情”数据选项卡(红色箭头)列出了空气污染标记物(例如颗粒物、硫酸盐和碳)的2591个结果(红圈),包括检测标记物的介质类型、测量单位、与测量相关的统计数据(蓝框)以及任何疾病/表型结果。这个视图聚合了所有相关文章的数据。表格中的列标题将通过单击(蓝色箭头)对信息进行排序,嵌入的术语超链接到各自的CTD页面(绿色箭头和绿色插入框),允许用户轻松导航到其他概念。在每个CTD页面的底部,一个链接允许用户以各种格式将信息下载到桌面上。

图3。

为曝光科学策划的真实世界测量和结果的景观视图。CTD空气污染物化学页面上的“暴露详情”数据选项卡(红色箭头)列出了空气污染标记物(例如颗粒物、硫酸盐和碳)的2591个结果(红圈),包括检测标记物的介质类型、测量单位、与测量相关的统计数据(蓝框)以及任何疾病/表型结果。这个视图聚合了所有相关文章的数据。表格中的列标题将通过单击(蓝色箭头)对信息进行排序,嵌入的术语超链接到各自的CTD页面(绿色箭头和绿色插入框),允许用户轻松导航到其他概念。在每个CTD页面的底部,一个链接允许用户以各种格式将信息下载到桌面上。

2016年7月,CTD从1250篇暴露科学文章中收录了803种化学物质、153种生物标志物基因、301种疾病和181种表型(GO-BP术语)的70600多份人工筛选的暴露声明(图2摄氏度).曝光数据也免费提供给用户下载文件(http://ctdbase.org/downloads/#exposureevents).

go -疾病推论的新可用性

在过去十年(4), CTD成功地在不同类型的数据之间建立了新颖的连接,将不同的信息通过一个公共中间体(167).例如,如果基因A被GO注释器注释为GO生物过程术语B,并且基因A也独立与C疾病相关(通过CTD生物标记器),那么GO术语B可以被推断为C疾病(通过基因A)(图)4).这些go疾病推断有助于用户发现看似无关的疾病之间共有的常见分子、生物和细胞事件(图2)4 b).这个新数据集的可用性(27)可以在许多方面加以利用,包括发现潜在的共病(特别是在暴露科学中),通过重新定位药物或确定可能的副作用来可能的新治疗方案。CTD的go -疾病基因推断网络文件可免费获得(http://ctdbase.org/downloads/#godiseasegenes),并在2016年7月包括了超过15700个GO术语和4200种疾病之间的超过79.5万个推论。

图4。

CTD的新数据集在GO术语和疾病之间产生了新的推论。(一个每个GO术语在CTD中都有自己的页面,GO术语可以根据共享的基因推断疾病。通过共享基因(这里,基因IL4和TNF,绿框)进行数据整合,可以推断GO生物过程(GO- bp)术语“单个核细胞迁移的正向调节”(橙色椭圆)与心肌病(红圈)有关。(B用户如何利用这些信息的一个例子。两种疾病(心肌病和接触性皮炎)最初看起来不相关,因为它们没有共同的基因;然而,当使用推断的GO-BP术语来观察时,这两种疾病与583个推断的GO-BP术语有显著重叠(P= 4.72 × 10-201年这表明,这两种病理之间存在潜在的共同分子基础。这一发现可能会对识别共病(特别是暴露科学),确定重新定位治疗药物的途径或对潜在的新副作用发出警报产生影响。CTD的“go -疾病基因推断网络”文件(以及所有CTD策划的内容)可从我们的“数据下载”页面(http://ctdbase.org/downloads/).

图4。

CTD的新数据集在GO术语和疾病之间产生了新的推论。(一个每个GO术语在CTD中都有自己的页面,GO术语可以根据共享的基因推断疾病。通过共享基因(这里,基因IL4和TNF,绿框)进行数据整合,可以推断GO生物过程(GO- bp)术语“单个核细胞迁移的正向调节”(橙色椭圆)与心肌病(红圈)有关。(B用户如何利用这些信息的一个例子。两种疾病(心肌病和接触性皮炎)最初看起来不相关,因为它们没有共同的基因;然而,当使用推断的GO-BP术语来观察时,这两种疾病与583个推断的GO-BP术语有显著重叠(P= 4.72 × 10-201年这表明,这两种病理之间存在潜在的共同分子基础。这一发现可能会对识别共病(特别是暴露科学),确定重新定位治疗药物的途径或对潜在的新副作用发出警报产生影响。CTD的“go -疾病基因推断网络”文件(以及所有CTD策划的内容)可从我们的“数据下载”页面(http://ctdbase.org/downloads/).

疾病映射和链接

自2006年以来,CTD一直维护和使用MEDIC作为疾病信息管理的实用词汇(25).MEDIC是通过合并来自OMIM资源(28),设有两个医学学科标题疾病等级(29)以产生广泛的、可导航的词汇。虽然最初打算只是一个占位符,直到出现更复杂的疾病资源,但MEDIC已被证明是非常成功的,方便和适应性强,并已被许多系统(30.- - - - - -34).2015年,CTD开始分析和比较MEDIC中使用的疾病术语和层次结构与新建立的疾病本体(DO) (35),以协调MEDIC与这些新资源。一个单一的、强大的、社区接受的疾病词汇表对于同步大量不同的生物数据库是有价值的。为此,CTD正在与DO的工作人员协调,以寻找medc可以帮助通知DO的方法,反之亦然。作为第一步,CTD现在提供了3258个MEDIC疾病术语与DO中2943个等效术语之间的直接网络链接,这些链接基于两个词汇表之间共享的通用MeSH接入标识号。最终,MEDIC和DO之间的双向交叉链接将为整个科学界实现更大的互操作性和数据共享。

未来的发展方向

自2004年以来,CTD已从一个初具规模的数据库发展成为一个广泛的公共资源,拥有超过3050万个毒理学基因组关系(表2)1).我们将继续扩展我们的核心和曝光管理模块,每个月都会增加新的数据内容(http://ctdbase.org/about/dataStatus.go).

此外,我们计划加强和开发新的可视化和分析工具,以帮助用户更好地探索我们策划的暴露科学数据。两个目标包括允许用户选择在web页面上显示哪些数据字段,以及丰富查询页面以允许对返回的数据进行更大的规范和过滤。我们还计划利用基于网络的地图,从地理角度查看暴露化学品、事件和结果。目前在CTD中,我们有109个国家和美国所有50个州的暴露数据。

同时,我们打算发布一个新的表型模块,它将包括我们的化学物质调节生物、细胞和生理事件的手工管理,以及解剖学描述符。这一特征将有助于关联和识别先于疾病临床表现的化学诱导表型。我们之前发布了这个数据集的初始存储,使用MeSH术语作为我们的表型描述(26);然而,从那时起,我们已经将这些术语映射到更通用的GO-BP控制词汇表,以反映更大的粒度和更广泛的生物学概念。

最后,我们计划设计计算程序,通过将化学-基因启动事件、化学-表型和基因- go关键事件、化学-疾病事件和人群暴露水平结果联系起来,系统地连接CTD策划内容的频谱。这种计算预测的不良结局途径(cpAOP)最近已被描述为脂肪性肝病使用大鼠数据(36).我们希望通过利用CTD数据来系统地扩展这一努力,以生成将化学物质与疾病结果联系起来的cpAOPs。

总结

  • 我们将CTD含量提高了33%,达到3050万毒理基因组关系。

  • 我们介绍了我们的暴露科学模块,包含超过800种化学物质、150种基因、300种疾病和180种表型的70600份暴露声明。

  • 我们描述了我们的go疾病推断数据集,将看似不相关的疾病之间的功能、生物学和细胞事件连接起来。

  • 我们通过提供从MEDIC疾病词汇到DO术语的链接,增强了社区数据库的互操作性。

引用并链接到CTD

如需引用CTD数据,请参见:http://ctdbase.org/about/publications/#citing.如阁下有意建立连结至CTD数据,请通知我们(http://ctdbase.org/help/contact.go),并遵照以下指示:http://ctdbase.org/help/linking.jsp

资金

国家环境卫生科学研究所[R01 ES014065, R01 ES019604, R01 ES023788];国家普通医学科学研究所国家卫生研究院机构发展奖[P20 GM103423, P20 GM104318至B.L.K];开放获取收费资助:国家环188滚球软件境卫生科学研究所[R01 ES014065, R01 ES019604, R01 ES023788]。

利益冲突声明.没有宣布。

参考文献

1.

戴维斯
美联社
墨菲
C.G.
Saraceni-Richards
c.a
Rosenstein
贝拉
Wiegers
教学楼。
Mattingly
C.J.
比较毒理学基因组数据库:化学-基因-疾病网络的知识库和发现工具
核酸测定。
2009
37
D786
- - - - - -
D792

2.

戴维斯
美联社
文学士
莫卡斯
年代。
墨菲
C.G.
Saraceni-Richards
C。
Rosenstein
M。
Wiegers
T。
Mattingly
C.J.
比较毒理基因组学数据库:2011年更新
核酸测定。
2011
39
D1067
- - - - - -
D1072

3.

戴维斯
美联社
墨菲
C.G.
约翰逊
R。
J.M.
Lennon-Hopkins
K。
Saraceni-Richards
C。
Sciaky
D。
文学士
Rosenstein
贝拉
Wiegers
教学楼。
比较毒理基因组学数据库:2013年更新
核酸测定。
2013
41
D1104
- - - - - -
D1114

4.

戴维斯
美联社
Grondin
C.G.
Lennon-Hopkins
K。
Saraceni-Richards
C。
Sciaky
D。
文学士
Wiegers
教学楼。
Mattingly
C.J.
比较毒理基因组学数据库十周年:2015年更新
核酸测定。
2015
43
D914
- - - - - -
D920

5.

戴维斯
美联社
Wiegers
教学楼。
Rosenstein
贝拉
墨菲
C.G.
Mattingly
C.J.
在比较毒理学基因组学数据库中,用于手工管理科学文献的管理范式和应用工具
数据库
2011
doi: 10.1093 /数据库/ bar034

6.

戴维斯
美联社
墨菲
C.G.
Rosenstein
贝拉
Wiegers
教学楼。
Mattingly
C.J.
比较毒理学基因组学数据库有助于确定和理解化学-基因-疾病之间的关联:以砷为例
BMC医学基因组学
2008
1
doi: 10.1186 / 1755-8794-1-48

7.

文学士
戴维斯
美联社
Rosenstein
贝拉
Wiegers
教学楼。
Mattingly
C.J.
在比较毒理学基因组学数据库中使用局部网络拓扑对传递性化学疾病推论进行排序
《公共科学图书馆•综合》
2012
7
e46524

8.

Wiegers
教学楼。
戴维斯
美联社
Mattingly
C.J.
协同生物管理-文本挖掘开发任务,用于管理文档的优先级排序
数据库
2012
doi: 10.1093 /数据库/ bas037

9.

Arighi
灯光。
h
科恩
K.B.
赫希曼
l
Krallinger
M。
瓦伦西亚
一个。
Z。
威尔伯
J.W.
Wiegers
教学楼。
BioCreative-IV虚拟发行
数据库
2014
doi: 10.1093 /数据库/ bau039

10.

Wiegers
教学楼。
戴维斯
美联社
Mattingly
C.J.
基于Web服务的文本挖掘展示了对互操作性和流程简化的广泛影响
数据库
2014
doi: 10.1093 /数据库/ bau050

11.

h
Y。
利曼
R。
戴维斯
美联社
Mattingly
C.J.
J。
Wiegers
教学楼。
Z。
评估生物医学关系提取的最新状况:BioCreative V化学疾病关系(CDR)任务概述
数据库
2016
doi: 10.1093 /数据库/ baw032

12.

J。
太阳
Y。
约翰逊
效力
Sciaky
D。
h
利曼
R。
戴维斯
美联社
Mattingly
C.J.
Wiegers
教学楼。
Z。
et al。.
BioCreative V CDR任务语料库:化学疾病关系提取资源
数据库
2016
doi: 10.1093 /数据库/ baw068

13.

Mattingly
C.J.
波义耳氏
R。
Lawler
C.P.
Haugen
交流
Dearry
一个。
Haendel
M。
为环境健康科学数据驱动语义标准奠定基于社区的基础
环绕。健康教谕。
2016
124
1136
- - - - - -
1140

14.

McQuilton
P。
Gonzalez-Beltran
一个。
Rocca-Serra
P。
瑟斯顿
M。
李斯特
一个。
马奎尔
E。
桑松
S.A.
生物共享:生命科学中策划和众包的元数据标准、数据库和数据政策
数据库
2016
doi: 10.1093 /数据库/ baw075

15.

Gaudet
P。
Bairoch
一个。
D。
桑松
S.A.
泰勒
C。
Attwood
T.K.
贝特曼
一个。
布莱克
正当
布尔特
C.J.
樱桃
J.M.
et al。.
朝向BioDBcore:社区定义的生物数据库信息规范
数据库
2011
doi: 10.1093 /数据库/ baq027

16.

Grondin
C.J.
戴维斯
美联社
Wiegers
教学楼。
文学士
Wiegers
正当
赖夫
D.M.
Hoppin
正当
Mattingly
C.J.
通过比较毒理学基因组学数据库中的化学数据管理和整合,推进暴露科学
环绕。健康教谕。
2016
doi: 10.1289 / ehp174

17.

Hubal
电子艺界
21世纪毒性测试的生物相关暴露科学
Toxicol。科学。
2009
111
226
- - - - - -
232

18.

野生
C.P.
用“暴露体”补充基因组:分子流行病学中环境暴露测量的突出挑战
癌症的论文。生物标志物上一页。
2005
14
1847
- - - - - -
1850

19.

ashburn
M。
c.a
布莱克
正当
Botstein
D。
巴特勒
H。
樱桃
J.M.
戴维斯
美联社
Dolinski
K。
德怀特
埃皮格
j.t
et al。.
基因本体论:生物学统一的工具
Nat,麝猫。
2000
25
25
- - - - - -
29

20.

Kanehisa
M。
佐藤
Y。
川岛
M。
Furumichi
J。
田边
M。
KEGG作为基因和蛋白质注释的参考资源
核酸测定。
2016
44
D457
- - - - - -
D462

21.

Fabregat
一个。
Sidiropoulos
K。
Garapati
P。
Gissespie
M。
豪斯曼
K。
山楂
R。
Jassal
B。
女裙
年代。
Kominger
F。
麦凯
年代。
et al。.
Reactome通路知识库
核酸测定。
2016
44
D481
- - - - - -
D462

22.

Chatr-Aryamontri
一个。
Breitkreutz
B.J.
Oughtred
R。
布歇
l
Heinicke
年代。
D。
斯塔克
C。
Breitkreutz
一个。
可乐
N。
奥唐纳
l
et al。.
BioGRID交互数据库:2015年更新
核酸测定。
2015
43
D470
- - - - - -
D478

23.

佩尔蒂埃
D。
Wiegers
教学楼。
Enayetallah
一个。
Kibbey
C。
Gosink
M。
Koza-Taylor
P。
Mattingly
C.J.
劳顿
M。
毒物评估器:一个集成的计算平台,以帮助解释毒理学研究相关的发现
数据库
2016
doi: 10.1093 /数据库/ baw062

24.

Mattingly
C.J.
McKone
式样
卡拉汉
硕士
布莱克
正当
Hubal
电子艺界
提供缺失的环节:暴露科学本体ExO
环绕。科学。抛光工艺。
2012
46
3046
- - - - - -
3053

25.

戴维斯
美联社
Wiegers
教学楼。
Rosenstein
贝拉
Mattingly
C.J.
MEDIC:用于比较毒理学基因组学数据库的实用疾病词汇
数据库
2012
doi: 10.1093 /数据库/ bar065

26.

戴维斯
美联社
Wiegers
教学楼。
罗伯茨
文学士
J.M.
Lennon-Hopkins
K。
Sciaky
D。
约翰逊
R。
基廷
H。
格林
N。
et al。.
ctd -辉瑞合作:人工管理88000篇科学文章,挖掘药物-疾病和药物-表型相互作用
数据库
2013
doi: 10.1093 /数据库/ bat080

27.

戴维斯
美联社
Wiegers
教学楼。
文学士
Wiegers
J。
Grondin
C.J.
Sciaky
D。
约翰逊
效力
Mattingly
C.J.
在比较毒理学基因组学数据库中生成基因本体论-疾病推断以探索人类疾病的机制
《公共科学图书馆•综合》
2016
11
e0155530

28.

Amberger
J.S.二
Bocchini
c.a
Schiettecatte
F。
斯科特
自动跟踪
Hamosh
一个。
OMIM.org:在线孟德尔遗传在人(OMIM),一个在线目录的人类基因和遗传疾病
核酸测定。
2015
43
D789
- - - - - -
D798

29.

Coletti
M.H.
布莱西
上半叶
用于搜索生物医学文献的医学主题标题
j。医生,通知协会。
2001
8
317
- - - - - -
323

30.

海曼
G.T.
Laulederkind
中华民国
史密斯
jr
中华民国
佩特里
V。
尼噶的
R。
Tutaj
M。
德桥
J。
Dwinell
核磁共振
shinmoyama教授
M。
大鼠基因组数据库中的疾病入口、疾病基因注释和RGD疾病本体
数据库
2016
doi: 10.1093 /数据库/ baw034

31.

利曼
R。
Islamaj-Dogan
R。
Z。
DNorm:疾病名称归一化,成对学习排序
生物信息学
2013
29
2909
- - - - - -
2917

32.

H.C.
Y.Y.
花王
H.Y.
audi:生物医学文本中的自动crf增强疾病规范化
数据库
2016
doi: 10.1093 /数据库/ baw091

33.

shinmoyama教授
M。
史密斯
jr
德桥
J。
Tutaj
M。
Khampang
P。
在香港
W。
Erbe
C.B.
埃利希
国民生产总值
Bakaletz
润滑油
Kerschner
J.E.
栗鼠研究资源库:耳鼻喉疾病模型的资源
数据库
2016
doi: 10.1093 /数据库/ baw073

34.

H.J.
J.C.
至此
雷耶斯
抗干扰
菲律宾人质罗莎
硕士
Syed-Abdul
年代。
保留时间
朱柔
LiverCancerMarkerRIF:一个结合文本挖掘和专家注释的肝癌生物标志物交互管理系统
数据库
2014
doi: 10.1093 /数据库/ bau085

35.

基布
西澳
Arze
C。
费利克斯
V。
Mitraka
E。
博尔顿
E。
G。
Mungall
C.J.
粘结剂
耶稣基督
马龙
J。
瓦桑
D。
et al。.
疾病本体论2015更新:一个扩展和更新的人类疾病数据库,用于将生物医学知识与疾病数据联系起来
核酸测定。
2015
43
D1071
- - - - - -
D1078

36.

贝尔
克里
Angrish
M.M.
刚建成时
爱德华兹
S.W.
整合公开数据,计算预测脂肪肝的不良结局途径
Toxicol。科学。
2016
150
510
- - - - - -
520

作者指出

免责声明:内容仅为作者的责任,并不一定代表美国国立卫生研究院的官方观点。

这是一篇开放获取文章,188滚球软件根据创作共用属性许可协议(http://creativecommons.org/licenses/by-nc/4.0/),允许在任何媒介上非商业性地重复使用、分发和复制,前提是正确地引用原创作品。如有商业用途,请联系journals.permissions@oup.com

评论

0评论
提交评论
您输入的代码无效
感谢您对本文的评论。您的评论将由杂志自行审查和发表。请通过电子邮件查看进一步通知。