跳到主页内容
访问键 NCBI主页 MyNCBI主页 主要内容 主导航
2008年12月29日,9:559。
DOI:10.1186 / 1471-2105-9-559。

加权相关网络分析的R包

隶属关系
免费的PMC的文章

加权相关网络分析的R包

彼得Langfelderet al。 BMC生物信息学
免费的PMC的文章

摘要

背景:相关网络越来越多地用于生物信息学应用。例如,加权基因共表达网络分析是用于描述微阵列样本中基因之间的相关模式的系统生物学方法。加权相关网络分析(WGCNA)可用于查找高度相关基因的簇(模块),总结使用模块EIGENGENE或血腔内枢纽基因的这种簇,​​用于将模块相互联系和外部样品特征(使用EIGENGENE网络方法),以及计算模块成员措施。相关网络促进基于网络的基因筛选方法,可用于识别候选生物标志物或治疗靶标。这些方法已成功地应用于各种生物背景中,例如,癌症,小鼠遗传学,酵母遗传学和脑成像数据分析。虽然在单独的出版物中描述了相关网络方法的部分,但需要提供用户友好,全面和一致的软件实现和随附的教程。

结果:WGCNA R软件包是一个R函数的综合集合,用于执行加权相关网络分析的各个方面。该软件包包括网络构建、模块检测、基因选择、拓扑属性计算、数据模拟、可视化和与外部软件接口的功能。除了R包,我们还提供了R软件教程。虽然这些方法的发展是由基因表达数据驱动的,但底层数据挖掘方法可以应用于各种不同的设置。

结论:WGCNA包提供了用于加权相关网络分析的R功能,例如,基因表达数据的共表达网络分析。R封装以及其源代码和附加材料可在http://www.genetics.ucla.edu/labs/horvath/coexpressionnetwork/rpackages/wgcna上免费提供。

数字

图1
图1
WGCNA方法论概述.这张流程图简要介绍了加权基因共表达网络分析的主要步骤。
图2
图2
网络可视化情节.A.全网络连通性分布的对数-对数图。的x-轴表示整个网络连通性的对数,y- 相应频率分布的对数。在此绘制的绘图中,分布大致遵循直线,这被称为无垢无级拓扑。B.古典多维缩放结果。模块倾向于在此绘图中形成单独的“手指”。血管内轮毂基因位于手指尖端。C.网络热图绘图。分层聚类树形图中的分支对应于模块。颜色编码的模块成员资格显示在下面的彩色条和树木图右侧。在热图中,通过逐渐更饱和的黄色和红颜色表示高共表达互连。模块对应于高度互连基因的块。 Genes with high intramodular connectivity are located at the tip of the module branches since they display the highest interconnectedness with the rest of the genes in the module.
图3
图3
模块和特征基因网络图.A.跨模块平均基因显著性的Barplot。在这个例子中,我们使用基于性状的基因显著性,公式2。一个模块的平均基因显著性越高,该模块与感兴趣的临床特征的相关性越显著。B.基因意义散点图(y-axis)与模块成员关系(x-axis)的最显著模块(绿色模块,见面板A)。在与兴趣特征相关的模块中,具有高模块成员的基因通常也具有高基因显著性。C.模块特征基因(以颜色标记)和微阵列样本性状的层次聚类树状图y.D.在包括特征的特征网络中的邻接中的邻接曲线图y.热图中的每一行和每一列对应一个模块特征基因(以颜色标注)或特征(以y).在热图中,绿色代表低邻接(负相关),红色代表高邻接(正相关)。
图4
图4
WGCNA分析雌性小鼠肝脏表达数据.A.平均连锁等级聚类得到的基因树状图。树状图下面的颜色行显示了动态树切割决定的模块分配。B.基因网络拓扑重叠的热图。在热图中,每一行和每一列对应一个基因,浅色表示拓扑重叠度低,红色逐渐加深表示拓扑重叠度高。沿对角线较暗的方块对应模块。左侧和顶部显示了基因树状图和模块分配。C.模块特征基因的层次聚类,总结聚类分析中发现的模块。树状图的分支(元模块)将正相关的特征基因分组在一起。D.特征基因网络中包含性状权重的邻接关系的热图。 Each row and column in the heatmap corresponds to one module eigengene (labeled by color) or weight. In the heatmap, green color represents low adjacency (negative correlation), while red represents high adjacency (positive correlation). Squares of red color along the diagonal are the meta-modules. E. A scatterplot of gene significance for weight (GS, Equation 2) versus module membership (MM, Equation 6) in the brown module. GS and MM exhibit a very significant correlation, implying that hub genes of the brown module also tend to be highly correlated with weight. F. The network of the 30 most highly connected genes in the brown module. In this network we only display a connection of the corresponding topological overlap is above a threshold of 0.08.

类似的文章

引用的5208年文章

参考

    1. 费舍尔RA。从小样本中推导出的相关系数的“可能误差”。密特隆。1915;1:1-32。
    1. 基于基因表达数据最短路径分析的传递功能注释。美国国家科学院学报。2002; 99:12783 - 12788。-PMC-PubMed
    1. Steffen M,Petti A,Aach J,D'Haeeleer P,教堂G.信号转导网络自动建模。BMC生物信息学。2002; 3:34。-PMC-PubMed
    1. 基于基因共表达网络的保守基因模块的发现。科学。2003;302:249 - 255。-PubMed
    1. 张志强,张志强。基于遗传算法的基因共表达网络分析。Stat Appl Genet Mol Biol. 2005;4:第十七条。-PubMed

出版类型

网格计算