相信大家對Y叔的clusterprofiler這個R包并不陌生,一般做基因富集分析的時候都會用到這個R包。這個包非常實用,并且畫出來的圖也很不錯。
其實小編前面已經(jīng)花了不少篇幅給大家介紹過如何使用這個R包做GO富集分析和結(jié)果可視化,以及如何將富集結(jié)果中的gene ID轉(zhuǎn)成基因名字
?GO富集分析四種風(fēng)格展示結(jié)果—柱形圖,氣泡圖
還有計算富集倍數(shù)的三種方法
?GO和KEGG富集倍數(shù)(Fold Enrichment)如何計算
對于沒有太多基礎(chǔ)的小伙伴,小編還特地錄制了視頻進行了詳細的講解
當(dāng)然使用clusterprofiler這個R包也可以進行KEGG富集分析
當(dāng)然小編也將以上所有內(nèi)容整理成了一個系統(tǒng)的線上課程
我們知道一般做富集分析,都需要有一個注釋數(shù)據(jù)庫。里面存放了對每個基因的注釋信息,告訴我們這個基因?qū)儆谀且粭lKEGG通過,參與到那些生物學(xué)過程(BP),有那些生物學(xué)功能(MF)以及屬于哪一種細胞成分(CC)。一般我們對人這個物種中的基因做富集分析的時候,都會用到org.Hs.eg.db這個注釋數(shù)據(jù)庫,Hs代表的是human。小編也討論過如何安裝這個注釋數(shù)據(jù)庫。?加載R包org.Hs.eg.db出錯,避坑指南!
library(org.Hs.eg.db)
library(clusterProfiler)
ego <- enrichGO(gene = DEG,
OrgDb=org.Hs.eg.db,
ont = "all",
pAdjustMethod = "BH",
minGSSize = 10,
pvalueCutoff = 0.01,
qvalueCutoff = 0.01,
keyType='ENSEMBL')
那么問題來了,對于其他的物種,如小鼠,大鼠,線蟲等等,其他物種的注釋文件該如何獲取呢?
可以從下面這個網(wǎng)頁中查找,每一行代表一個物種的注釋文件。
http://bioconductor.org/packages/release/BiocViews.html#___OrgDb

在做分析的時候我們只需要將代碼中的org.Hs.eg.db更換成相應(yīng)的物種的注釋文件就可以了,例如我們換成小鼠的
library(org.Mm.eg.db)
library(clusterProfiler)
ego <- enrichGO(gene = DEG,
OrgDb=org.Mm.eg.db,
ont = "all",
pAdjustMethod = "BH",
minGSSize = 10,
pvalueCutoff = 0.01,
qvalueCutoff = 0.01,
keyType='ENSEMBL')
參考資料:
?GO富集分析四種風(fēng)格展示結(jié)果—柱形圖,氣泡圖