跳转到主页内容
美国国旗

美国政府的官方网站

点政府

gov表示它是官方的。
联邦政府网站通常以。gov或。mil结尾。在分享敏感信息之前,确保你是在联邦政府网站上。

Https

站点安全。
https://确保您连接到官方网站,并且您提供的任何信息都经过加密和安全传输。

访问键 NCBI主页 MyNCBI主页 主要内容 主导航
2018年6月,36(5):411 - 420。
doi: 10.1038 / nbt.4096。 Epub 2018年4月2日

整合不同条件、技术和物种的单细胞转录组数据

从属关系
免费PMC文章

整合不同条件、技术和物种的单细胞转录组数据

安德鲁·巴特勒et al。 生物科技Nat》 2018年6月
免费PMC文章

摘要

计算单细胞RNA-seq (scRNA-seq)方法已成功应用于代表单一条件、技术或物种的实验,以发现和定义细胞表型。然而,识别存在于多个数据集的细胞亚群仍然具有挑战性。在这里,我们介绍了一种基于共同变异源集成scRNA-seq数据集的分析策略,从而能够在数据集之间识别共享种群并进行下游比较分析。我们应用这种方法,在我们的R工具包Seurat (http://satijalab.org/seurat/)中实现,以对齐静息和刺激条件下的外周血单个核细胞的scRNA-seq数据集,使用两种分析技术测序的造血祖细胞,以及从人类和小鼠胰岛生成的胰腺细胞“图谱”。在每种情况下,我们在数据集上共同学习不同的或过渡的细胞状态,同时通过集成分析提高统计能力。我们的方法促进了scRNA-seq数据集的一般比较,有可能加深我们对不同细胞状态如何对扰动、疾病和进化做出反应的理解。

利益冲突声明

相互竞争的经济利益

作者声明没有相互竞争的经济利益。

数据

图1所示。
图1 . .单细胞RNA-seq数据集的Seurat比对概述
(一)药物治疗后的病例/对照研究中异质人群的玩具例子。四种类型的细胞用不同的符号绘制,而刺激条件用颜色编码。在标准的工作流程中,细胞通常根据细胞类型和刺激条件聚类,这为下游比较分析带来了挑战。(B)Seurat对齐过程使用典型相关分析来识别跨数据集的共享相关结构,并使用动态时间扭曲对齐这些维度。对齐后,单元格被嵌入到共享的低维空间中(这里用tSNE在2D中可视化)。(C)校准后,单个集成聚类可以识别不同条件下的保守细胞类型,允许进行比较分析,以确定细胞类型比例的变化,以及细胞类型对药物治疗的特异性转录反应。
图2。
图2 . .静息和刺激PBMC的综合分析
(两者)在(A)对齐前和(B)对齐后,14,039个人pbmc的tSNE图在对照和IFN-β刺激条件下分裂。对齐后,不同刺激条件下的细胞根据共享的细胞类型分组在一起,允许单个联合聚类(C)来检测13个免疫群体。(D)综合分析揭示了细胞类型的标记(在刺激条件下保守),IFN-β反应的统一标记(独立于细胞类型),以及不同细胞类型的IFN-β反应成分。每个圆圈的大小反映了检测到基因的集群中细胞的百分比,颜色反映了每个集群中的平均表达水平。(E)受刺激细胞和未受刺激细胞在每个簇(n = 13簇)中的细胞比例(8个供体的中位数)。(F)常规树突状细胞和浆细胞样树突状细胞对IFN-β的异质反应示例(补充图4B所示的全局分析)。每一列表示单个患者体内单个细胞的平均表达量。仅显示至少5个细胞的患者/群集组合。(G)细胞类型对IFN-β的特异性反应的相关热图(n = 430个基因,静息和刺激之间有> ln(2)的差异)(T和DC亚群的个体相关性见补充图4A-B)。来自髓系和淋巴系的细胞表现出高度相关的反应,但浆细胞样树突状细胞表现出独特的IFN-β反应。
图3。
图3 . .scRNA-seq技术对小鼠造血祖细胞的比较分析
(两者)使用MARS-seq(2,686)和SMART-Seq2(765)对来自小鼠骨髓的3,451个造血祖细胞进行tSNE图测序,测序前(A)和后(B-C)对齐。对齐后,细胞根据共享的祖细胞类型组合在一起,而不考虑测序技术。(c - d)来自SMART-Seq2数据集的细胞被映射到最近的MARS-Seq集群和相关谱系(来自Paul等人)。(C)由指定谱系着色的细胞tSNE图。(D) SMART-Seq2谱系分配(来自Nestorawa等人)和MARS-Seq集群之间的映射对应关系。(E-F)热图显示MARS-Seq和SMART-Seq2数据集中谱系特异性基因表达模式。每一列表示按原始MARS-Seq聚类分配(E)或它们映射到的MARS-Seq聚类(F)对细胞进行分组后的平均表达。(G-H)两个数据集中的红系细胞的综合扩散图显示了一个对齐的发育轨迹(G),具有保守的“伪时间”动力学(H)。(我)在两个数据集上比较每个基因在发育轨迹上的表达范围(绝对值)的散点图。
图4。
图4 . .人类和小鼠胰岛scRNA-seq图谱中细胞类型的联合鉴定
(两者)在(A)对齐前和(B)对齐后,来自人类(n = 8,424个细胞)和小鼠(n = 1,767个细胞)供体的10,191个胰岛细胞的tSNE图。对齐后,基于共享细胞类型的细胞跨物种分组,允许联合聚类(C)检测10个细胞群。(d e)人与小鼠之间共享细胞类型标记的无监督识别。跨物种联合DE测试鉴定的基因单细胞表达热图。(F)小提琴图显示了人类(n = 2431个细胞)和小鼠(n = 762个细胞)的β细胞集群中选择基因的基因表达分布,以及人类(n = 126个细胞)和小鼠(n = 10个细胞)的应激β细胞集群。(G)在这两个物种的β细胞的ER-应激亚群中,上调的前n=100个基因对ER未折叠蛋白应激反应的成分强烈富集。GO浓缩是使用GOplot R包可视化的。
图5。
图5 . .基准校准和批量校正方法
(a, d, g, j, m)tSNE图用于PBMC数据集(n = 14,039个细胞)(A)、造血祖细胞数据集(n = 3,451个细胞)(B)、胰岛细胞数据集(n = 10,306个细胞)(C)、多个人类胰岛细胞数据集(n = 6,224个细胞)(J)和多个PBMC数据集(n = 16,653个细胞)(M),经过ComBat和校正(b e h k n)limma。(c, f, i, l, o)使用Seurat对齐程序、ComBat、limma校正后和未校正后的对齐评分柱状图。Seurat对齐在所有五个例子中都优于其他方法。补充图15显示了Seurat无法对齐来自不同组织的数据集的“阴性对照”的其他示例。

类似的文章

引用的

发布类型

LinkOut -更多的资源