7.富集分析(Metascape数据库)

“实践是检验真理的唯一标准。”

“复现是学习R语言的最好办法。”

2021.4.12_1

DOI: 10.1016/j.cell.2020.05.032

这篇2020年发表在cell上关于新冠的组学文章里面有大量的生信内容。今天带大家复现其中的一个Supplemental Figure富集分析

本文示例数据领取:后台回复“20210430

富集分析

基因功能富集分析,是指借助各类数据库和分析工具进行统计分析,挖掘在数据库中与我们要研究的生物学问题具有显著相关性的基因功能类别。它的统计原理是用超几何分布型来检验一组基因(共表达或差异表达)中某个功能类的显著性,通过离散分布的显著性分析、富集度分析和假阳性分析, 得出与实验目的有显著关联的、低假阳性率的及靶向性的基因功能类别。

Metascape数据库

Metascape将40多种生物信息学知识库整合到一个单一的用户界面中。数据库更新更快,效果更好。输出结果容易理解,图表质量较高。整合了GOKEGGUniProtDrugBank等多个权威的数据资源,使其不仅能完成通路富集和生物过程注释,还能做基因相关的蛋白质网络分析和涉及到的药物分析。

绘制

1. 打开数据库

  • Metascape

    http://metascape.org/gp/index.html#/main/step1

2. 输入文件格式

20210430_5

其他格式可点击示例数据查看:

20210430_6

3. 粘贴基因列表或者上传基因文件

20210430_2

点击Submit提交。

4.设置物种

20210430_7

5. 开始富集

  • 可以直接点击Express Analysis

    默认的Express Analysis会把许多个数据库,如Reactome、KEGG、Hallmark和GO数据库全部一起展示。

  • 点击custome Analysis进行设置。

我们以GO富集为例:

20210430_12

选好后,点击左上角enrichment analysis

分析时,基因组中的所有基因都被用作富集背景基因。默认阈值为,p< 0.01最小计数为3富集因子> 1.5(富集因子是观察到的计数和偶然期望的计数之间的比率)的条目被收集,并根据它们的隶属关系相似性分组到集群中。

6. 结果

打开图片,可保存为PDF.

20210430_11

其他数据库,如KEGG,步骤类似。


写在后面:

本系列重在复现,所以有些细节可能讲的不是很详细。大家有问题可以后台私信,或者在我的B站:木舟笔记进行互动!制作不易,谢谢大家多多支持!


往期内容:

跟着CELL学作图|1.火山图

跟着Cell学作图 | 2.柱状图+误差棒+散点+差异显著性检验

跟着 Cell 学作图 | 3.箱线图+散点+差异显著性检验

跟着 Cell 学作图 | 4.小提琴图

跟着Cell学作图 | 5.UMAP降维分析

跟着Cell学作图 | 6.时间序列分析(Mfuzz包) 

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐