富集分析是了解一个基因集功能倾向性的一个方式,在组学研究领域应用广泛。常见的有基于差异基因的Over-representation
分析,也就是常说的GO、KEGG富集分析和Functional class scoring
分析,如GSEA。这两种富集分析算法不同,但可以都支持同样的注释集,如GO、KEGG或其他类型的注释。基本原则只有一个:基因集的基因名字与注释集的基因名字能匹配。剩下的就是了解下原理去操作了。
今天给大家介绍的是Cytoscape的插件——ClueGO。ClueGO能以网络图的形式来展示GO富集结果。
除了在线工具和R代码,今天带来的是网络绘制工具Cytoscape的一个插件ClueGO
,支持200多个物种,支持数据库实时更新,支持多个注释数据集,支持多集合富集结果比较和网络图展示。配合Cytoscape的网络操作,可以做更多探索。下面看看怎么安装和使用吧。
ClueGO安装
官网下载
(http://apps.cytoscape.org/apps/cluego)
Cytoscape的APP Manager中下载
ClueGO激活
ClueGO第一次使用需要按照提示申请license
,申请网址为:http://www.ici.upmc.fr/cluego/cluegoLicense.shtml。 点击Request a license key
,填写基本信息之后提交审核,审核时间可能需要几天。拿到license之后点击App-ClueGO
,在弹出的提示框中输入license
即可激活ClueGO。
简单使用ClueGO
1. 上传数据
可以粘贴基因的id
、symbol
等或从本地上传文件 (富集分析的基因集只需要基因名字),我们以ClueGO的示例文件“CluePediaExampleFile_Th1RelatedGenes.txt”为例,并选择其对应物种和自动识别Gene id
类型选项。
2.选择富集数据集和富集标准
默认是BP(Biological Process),我们增加常用的CC(ellular component)和MF(Molecular Function)
然后勾选以下选项,目的是只显示p值<=0.05的富集结果。具体选择的富集显著性Pvalue
,可自行调整。
3.富集分析和结果展示
点击start
开始进行富集分析
运行结束后,会跳出一个简述富集结果信息的提示框,包括物种
, 基因名字
,匹配的注释信息
,重叠度
和冗余度
等信息。
Cytoscape的网络视图中展示的是富集结果的网络图。每个节点是代表性富集通路
,节点的连线表示通路之间的共有的基因数
,颜色表示该节点的富集情况分类
(隶属于哪个功能组,颜色也可以和表格形式的的ClueGO结果对应)。
ClueGO优势
1. 物种丰富,并支持手动下载
本地有人类和小鼠可选,也可根据需要下载,支持近200个物种。
2. 物种注释手动更新
(前面推荐的GOEAST是每周更新,这个可以认为是实时更新。R中的注释包相比来说更新的慢了些,需要社区发布新版本或自己整理。)
3. 多种网络布局和自由网络设计
多种网络布局类型选择
style
选项可对网络的颜色,节点,网络等进行修改
4. 多个数据集比较
同时导入2组或多组基因列表,可以进行比较分析。
富集结果
首先跳出了一个简述富集结果信息的提示框,和单组分析类似,包括物种
, 基因名字
,匹配的注释信息
,重叠度
和冗余度
等信息,但是额外统计了了两组共有的基因的富集结果。
Cytoscape的网络视图中展示的是富集结果的网络图。每个节点是代表性富集通路
,节点的连线表示通路之间的共有的基因数
,颜色表示该节点的富集情况分类
,而两组单独的,综合的,共有的富集通路等均可在ClueGO results详细看到。