Kegg通路或者GO本體論富集分析是基因功能注釋最常見的分析,結(jié)果可以以多種形式展示,最常用的包括:條形圖/bar圖,氣泡圖/dot圖等,其中氣泡圖輸入數(shù)據(jù)一般包括以下4個維度的信息:
名字,富集倍數(shù)(或者gene?ratio),P值,基因count。
例如:
pathwayenrichmentpvaluecount
RNA transport4.8072586411.56E-0515
Epstein-Barr virus infection4.5692617482.70E-0516
HTLV-I infection3.8146165210.00015324417
Tuberculosis3.4541809410.00035141413
MAPK signaling pathway3.3781315810.00041866716
Neurotrophin signaling pathway3.2121029710.00061361710
Long-term potentiation3.0000352660.0009999197
Dopaminergic synapse2.9670264550.00107888110
Endocytosis2.8413167310.00144106415
Herpes simplex infection2.7752191730.00167795712
?????????????????????4維分析結(jié)果
做出來的例圖如下(微生信平臺免費在線做氣泡圖)

富集氣泡圖
該圖包含的4維信息有:
1.Y軸的通路名(pathway,結(jié)果表格的第一列)
2.X軸的富集倍數(shù)(enrichment,結(jié)果表格的第二列)
[3.點的顏色(P值,結(jié)果表格的第三列)
4.點的大小(count,該通路中包含的基因與輸入基因列表交集的基因數(shù))。
其中基因的信息就丟失了,那么我們能否將基因的信息也加入到圖中呢?答案是肯定的!
讓我們先來看看5維的分析結(jié)果,以clusterProfiler結(jié)果為例:
DescriptionGeneRatiopvaluegeneIDCount
Circadian rhythm0.0140850.010497623RORA/RORB2
NOD-like receptor signaling pathway0.0281690.03303255CASP8/TRIP6/MAPK8/CASP14
PPAR signaling pathway0.0281690.008761306CD36/AQP7/LPL/CYP4A114
Viral myocarditis0.0281690.009484362CASP8/MYH7/SGCB/SGCD4
Hypertrophic cardiomyopathy (HCM)0.0422540.014532337MYH7/MYL2/MYL3/SGCB/SGCD/SLC8A16
Dilated cardiomyopathy0.0422540.020924238MYH7/MYL2/MYL3/SGCB/SGCD/SLC8A16
Osteoclast differentiation0.0492960.034284302LILRB5/MAPK8/FHL2/FCGR1A/IFNGR2/FOS/LILRB37
Phagosome0.0492960.018180176TUBA3D/THBS4/SFTPD/CD36/FCGR1A/TUBA3E/DYNC1I17
Huntington's disease0.0563380.001736229TBPL1/CASP8/VDAC3/CREB5/PPID/CLTB/NDUFA12/GRIN2B8
5維分析結(jié)果
根據(jù)這里的基因,我們可以在氣泡圖的基礎(chǔ)上,添加一個基因維度,列出基因名字。若下圖所示(瞬間眼前一亮有沒有)?

升級版的5維富集氣泡圖
該圖左側(cè)為基因,右側(cè)為常規(guī)的氣泡圖。
包含的5維信息有:
1.Y軸的通路名(pathway,結(jié)果表格的第一列)
2.X軸的基因ratio(gene?ratio,結(jié)果表格的第二列)
3.點的顏色(P值,結(jié)果表格的第三列)
4.基因名字(結(jié)果表格的第四列,圖中左側(cè)的桑吉圖,連線表示隸屬關(guān)系)
5.點的大小(count,結(jié)果表格的第五列)
秉承一貫簡潔的作用,微生信平臺支持直接輸入數(shù)據(jù),就可以做出來這張桑吉氣泡圖,嘗鮮版,趕緊試試吧!