条文本

下载PDF

审计、研究和指导更新
“LungGENS”:一个基于web的工具,映射单细胞基因表达在发展中肺
免费的
  1. Yina杜1,
  2. Minzhe郭1,2,
  3. 杰弗里·一个Whitsett1,
  4. 燕许1,3
  1. 1围产期和肺生物学,围产期新生儿学研究所和部分,辛辛那提儿童医院医学中心,俄亥俄州辛辛那提美国
  2. 2电气工程系和计算机系统,辛辛那提大学,俄亥俄州辛辛那提美国
  3. 3生物医学信息学分工,辛辛那提儿童医院医疗中心,俄亥俄州辛辛那提美国
  1. 对应到燕许博士的肺生物学、围产期研究所和生物医学信息学,辛辛那提儿童医院医学中心,伯内特大道3333,MLC7029,辛辛那提,哦,45229 - 3039,美国;Yan.Xu在}{cchmc.org

文摘

我们开发了LungGENS(肺在单细胞基因表达),一个基于网络的生物信息学资源查询单细胞基因表达数据库通过输入一个基因符号或基因列表或选择一个自己感兴趣的细胞类型。基因感兴趣的查询提供了定量的RNA表达基因在每个肺细胞类型。细胞类型查询返回相关选择性基因签名和基因编码细胞表面标记和转录因子在交互的热图和表。LungGENS将广泛适用于呼吸系统的研究,提供一个特异性RNA表达资源单细胞分辨率。LungGENS是免费为非商业用途https://research.cchmc.org/pbge/lunggens/default.html

  • 系统性疾病和肺
  • 表面活性剂的蛋白质
  • TTF-1
  • 气道上皮细胞

来自Altmetric.com的统计

请求的权限

如果你想重用任何或所有本文的请使用下面的链接,这将带你到版权税计算中心的RightsLink服务。你将能够获得快速的价格和即时允许重用内容在许多不同的方式。

介绍

肺是一个复杂的多细胞器官不同细胞类型的多样性组成的交互来完成肺形态发生和功能。知识对于增殖、分化和功能的单个细胞和细胞相互作用的机制,形成肺提供洞察肺形态发生的过程、功能和修复。最新进展在单细胞隔离和大规模并行DNA测序使解决单个细胞基因的表达情况,提供洞察细胞类型的多样性、基因网络指导细胞分化,不同细胞类型之间的复杂的相互作用。我们使用大规模并行DNA测序和一个公正的分析方法来识别单个细胞的主要细胞类型和mRNA签名隔绝整个胚胎小鼠肺囊状相的形态发生,活跃的增殖和分化(E16.5)在出生之前。提供丰富的知识库的数据,识别独特的贡献由多个肺细胞类型,和生物过程中介出生之前形成和肺功能(M郭,SINCERA:管道为单细胞RNA-Seq分析分析,提交)。处理和解释产生的广泛的RNA数据在单细胞水平在整个器官主要分析挑战。很少有易接近的web工具或数据库便于查询和可视化等复杂的基因表达模式。为了方便访问的单细胞转录组数据和复杂数据的可视化,我们开发了LungGENS(肺在单细胞基因表达),web工具用于映射基因表达模式在特定的肺细胞在单细胞水平。当前版本的LungGENS建成使用肺单细胞RNA-seq数据从胚胎小鼠肺,E16.5。计划和网站将延长表达数据从正在进行的研究的老鼠和人类在开发过程中肺LungMAP联盟,因为他们完成的和其他调查人员对肺癌生物学感兴趣。

方法

LungGENS是在Eclipse中开发(http://www.eclipse.org/),一个Java IDE(集成开发环境)。具体来说,HTML5, JavaScript与Java编程语言是用于LungGENS web页面和服务器开发。我们使用JSON (JavaScript对象表示法)来支持一个可互换的为这些编程语言数据结构,使得服务器和web应用程序之间的数据传输容易和语言无关的。

MYSQL,关系数据库管理系统,作为一个核心组件的web工具通过管理数据存储和检索。在数据库中,LungGENS数据集被分成几个关系数据表与基因名称和细胞类型主键。这种设计保证表查询和数据操作的效率和精度。关系数据表包括RNA-Seq基因表达、FPKM每百万碎片(每千碱基的外显子片段映射)或生,正常表达(z分数转换),总结基因,基因的相关性,细胞选择性基因签名,表面标记和相关的转录因子。

提供交互式数据可视化,Highchart (http://www.highcharts.com)是应用在网络工具开发。Highchart兼容现代移动和桌面浏览器(如Safari和Chrome)。LungGENS热图的组合使用,柱状图和条形图显示为单个细胞基因表达和统计结果。概要图(折线图)用于显示查询的条目后RNA表达谱基因及其20个最高度相关的基因可能与查询共享功能相似的基因。

结果

LungGENS是一个开放获取188滚球软件的工具,它可以自由访问https://research.cchmc.org/pbge/lunggens/default.html。搜索工具是易于使用,并提供两个不同的接口,方便用户定义的查询:查询基因和细胞类型的查询”中所描绘的一样图1

图1

LungGENS(肺在单细胞基因表达)提供了两个主要查询:查询基因和细胞类型的查询。

查询基因

“查询基因”允许用户输入一个基因感兴趣的象征。查询输出包括五个部分:

  • “识别”(IDs)部分:LungGENS提供外部链接查询基因映射到基准数据库和资源(NCBI GeneCard, MGI,运用和蛋白质图谱)。通过重定向用户这些权威数据库,用户可以很容易地吸收外部知识更全面了解感兴趣的基因。

  • “摘要”部分:LungGENS显示查询从148年单细胞基因表达与整个肺消化从胎鼠E16.5使用热图和个人酒吧图表。项目提供的意思是表达和t检验p值(负对数转换)的查询使用直方图基因在9个不同的细胞类型。LungGENS亮点的细胞类型查询基因更高度用红色表示。高亮显示的细胞类型是一个可点击的超链接将用户重定向到细胞类型的查询”页面。细胞表达水平最高,第二个最高的识别。

  • “细胞类型统计”部分:LungGENS总结细胞类型的统计数据查询基因,包括最大、最小、平均表达,细胞的数量和身份表达细胞的RNA和百分比表达它在每一个细胞类型。

  • 前20名相关基因的部分:LungGENS检索148最密切相关的基因在细胞预编译为每个查询基因关联表。数据作为一组图表资料,查询基因被用红色突出显示。表列出了20个最相关的基因,它们的相关系数和平均使用直方图表达在细胞类型显示9个。用户可以进一步研究密切相关的基因通过单击基因符号/ ID或下载后表进行进一步分析。

  • 动态的基因表达的部分:LungGENS重定向用户的肺发育基因表达谱,我们使用一个web工具肺发育时间进程核糖核酸微阵列数据。这个数据库允许用户查询动态RNA表达谱在prenatal-perinatal肺发展三个鼠标株/ J, C57BL / 6 J (B6)和Swiss-Webster应变,形象地表现为交互式线图。1,2查询基因的相对表达52不同组织图表显示为酒吧。3

当前版本的LungGENS既支持查询单基因和基因的查询列表”。“查询基因列表”允许用户输入或粘贴的基因识别感兴趣的细胞类型列表组基因选择性表达。搜索引擎将检索列表中每一个基因的表达谱数据库中的所有细胞类型(E16.5数据在当前版本)和使用t检验比较不同细胞类型的基因。然后描述使用细胞类型分布比例饼图表示的基因选择性表达的每一个细胞类型t检验p值< 0.05。基因t检验p值> 0.05随意拍摄了被定义为表达。相应的热图和基因列表与每个细胞类型相关联。功能丰富的基因集可以通过提交列表来执行“Toppgene套件”,另一个辛辛那提儿童医院医学中心(CCHMC)开发web工具(https://toppgene.cchmc.org/)。4LungGENS为用户提供了交互和重定向功能选择签名从LungGENS基因或者相关基因,直接将他们导入Toppgene套件进行分析。

查询的细胞类型

细胞类型的查询的9使用户能够选择一个预定义的细胞类型(通过无监督层次聚类识别功能分析和生物标志物验证)(M郭,查询数据库,提交)。对于每个感兴趣的细胞类型,web工具将提供相对选择性基因签名,相关的细胞表面标记和转录因子。呈现了基因在一个交互式的热图,使用户能够比较所有单个细胞的基因表达在9个主要细胞集群。每个热图和一个数据表,其中包含有关基因符号,合奏ID、t检验p值(p值越低,选择性与查询相关的RNA细胞类型)和意思表达9细胞类型。基因符号和合奏ID列设计与超链接让用户重定向细胞类型查询基因在LungGENS查询页面。LungGENS提供了一个与每个表相关的搜索框,使用户能够确定如果他们感兴趣的基因是一个“签名基因”,是有选择性的对于一个给定的细胞类型。可以下载的热图和表。

除了E16.5单细胞RNA在CCHMC生成的数据,从老鼠的肺上皮细胞单细胞RNA-seq E18.5 Treutlein出版的,5可以在LungGENS搜索。用户可以选择“探索细胞类型(鼠标E18.5上皮)”下的“新查询功能”或选择“E18.5 (Mouse-Epi)”下拉菜单中列出在探索细胞类型的函数。经过选择的四种上皮亚型(即俱乐部细胞,纤毛细胞,肺泡I型和II型细胞),LungGENS将显示一个热图和酒吧图表代表每个签名基因的相对表达的四个上皮细胞类型。因为我们希望更多的肺单细胞数据将由研究团体,我们将添加新的表达式公布的数据集和可访问。

结论

根据我们所知,没有现成的网络工具让用户(1)输入自己感兴趣的基因识别肺癌细胞的基因表达或(2)输入感兴趣的细胞类型识别“签名”基因,表面标记和转录因子有选择地表达各种肺细胞类型。LungGENS旨在促进肺癌特异性基因表达信息的检索大量数据集来自单个细胞的RNA序列和集成到数据与先前的RNA表达研究小鼠肺在不同发育时期。

LungGENS开发代表美国国立卫生研究院的心肺血液研究所“LungMAP”研究项目。web开发的初始阶段是基于RNA-seq数据来自单个细胞在E16.5从胎鼠肺分离。当前LungGENS数据库将自然延伸到正在进行的数据从正常和不正常肺组织和细胞产生更多的物种,包括人类,额外的发育时间点。

确认

作者欣然承认开源图表库Highchart Highsoft作为公司开发的。

引用

脚注

  • 推特跟随燕许在@yanxubao

  • 贡献者YX和下巴web应用程序设计和监督;码数据库和web应用程序开发的;MG和YX导致数据分析和解释,所有作者的写作和修改的手稿。

  • 资金国家心脏、肺和血液研究所(NHLBI) U01 HL122642 (LungMAP)和R01 HL105433。

  • 相互竞争的利益没有宣布。

  • 出处和同行评议不是委托;外部同行评议。

  • 数据共享声明网络工具是免费为非商业用途https://research.cchmc.org/pbge/lunggens/default.html。的E16.5 RNA-seq单细胞数据是公开的https://research.cchmc.org/pbge/sincera.html下载