數(shù)據(jù)庫(kù)中定義了已知的基因集合:

包括H和C1-C7八個(gè)系列(Collection),每個(gè)系列內(nèi)容為:
H: hallmark gene sets (效應(yīng))特征基因集合,共50組;
比如細(xì)胞凋亡特征基因集:

特征基因集合
以下圖片均由3幅圖組合而成
C1: positional gene sets
位置基因集合,根據(jù)染色體位置,共326個(gè)
p1.選擇C1后出現(xiàn)的界面;p2.選擇對(duì)應(yīng)的染色體位置;p3.具體信息

C1
C2: curated gene sets
(專家)共識(shí)基因集合,基于通路、文獻(xiàn)等:這部分包括我們熟悉的KEGG信號(hào)通路等

C2
C3: motif gene sets
模式基因集合,主要包括microRNA和轉(zhuǎn)錄因子靶基因兩部分

C3
C4: computational gene sets
計(jì)算基因集合,通過挖掘癌癥相關(guān)芯片數(shù)據(jù)定義的基因集合

C4
C5: GO gene sets
Gene Ontology(基因本體論),包括BP(生物學(xué)過程biological process),CC(細(xì)胞原件cellular component)和MF(分子功能molecular function)三部分

C5
C6: oncogenic signatures
癌癥特征基因集合,大部分來(lái)源于NCBI GEO 未發(fā)表芯片數(shù)據(jù)

C6
C7: immunologic signatures:
免疫相關(guān)基因集合。

C7
我們可以看到MSigDB數(shù)據(jù)收錄的信息還是非常全面的,這個(gè)數(shù)據(jù)庫(kù)可以單獨(dú)使用和查詢,我們可以根據(jù)各種條件導(dǎo)出一系列感興趣的gene set
引用