GO富集分析、KEGG富集分析和GSEA的區(qū)別 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/481189718
GO是基因本體聯(lián)合會(huì)所建立的數(shù)據(jù)庫,旨在建立一個(gè)適用于各種物種的,對基因和蛋白質(zhì)功能進(jìn)行限定和描述的,并能隨著研究不斷深入而更新的語義詞匯標(biāo)準(zhǔn)。GO 提供了一系列的語義用于描述基因功能的概念/類,以及這些概念之間的關(guān)系。GO (Gene ontology)是功能注釋,即每個(gè)基因可能參與哪些pathway terms 或者 GO terms,沒有閥值。
1 分別從細(xì)胞組分(cellular component, CC)、分子功能(molecular function, MF)、生物過程(biological process, BP)對基因產(chǎn)物進(jìn)行了標(biāo)準(zhǔn)化描述;
2 對基因產(chǎn)物進(jìn)行簡單注釋,通過GO富集分析可以粗略了解差異基因富集在哪些生物學(xué)功能、途徑或者細(xì)胞定位。
KEGG(京都基因與基因組百科全書)是了解高級功能和生物系統(tǒng),從分子水平信息,尤其是大型分子數(shù)據(jù)集生成的基因組測序和其他高通量實(shí)驗(yàn)技術(shù)的實(shí)用程序數(shù)據(jù)庫資源,是國際最常用的生物信息數(shù)據(jù)庫之一,以“理解生物系統(tǒng)的高級功能和實(shí)用程序資源庫”著稱。KEGG是功能富集,即基因集(多個(gè)基因)可能顯著的集中在哪些功能上面,也可以說是在哪些通路上的富集。類似的通路數(shù)據(jù)庫有wikipathway,reactome等。
GSEA:基因集富集分析,用于確定先驗(yàn)基因集是否在兩種生物狀態(tài)(例如表型)之間差異顯著。
區(qū)別:
GO/KEGG差異基因的一刀切法——僅關(guān)注少數(shù)幾個(gè)顯著上調(diào)或下調(diào)的基因,容易遺漏部分差異表達(dá)不顯著卻有重要生物學(xué)意義的基因,忽略一些基因的生物特性、基因調(diào)控網(wǎng)絡(luò)之間的關(guān)系及基因功能和意義等有價(jià)值的信息
GSEA不需要指定明確的差異基因閾值,算法根據(jù)實(shí)際整體趨勢分析。