GSEA的原理可參考:https://cloud.tencent.com/developer/article/1426130
下載GSEA軟件
根據(jù)自己電腦內(nèi)存大小下載適合的版本:https://www.gsea-msigdb.org/gsea/downloads.jsp
1.準(zhǔn)備輸入數(shù)據(jù)
輸入數(shù)據(jù)如果是RNAseq的話,需要準(zhǔn)備基因的表達(dá)矩陣和表型數(shù)據(jù)。格式如下面的例子所示:
Example Datasets(http://software.broadinstitute.org/gsea/datasets.jsp)
以P53突變樣本為例:

下載P53的表型數(shù)據(jù)(cls文件)和基因表達(dá)數(shù)據(jù)(gct文件)
GSEA軟件其他需要的數(shù)據(jù)格式可參考:GSEA軟件支持的數(shù)據(jù)格式
P53.cls #表型文件,定義了表達(dá)文檔中樣品的表型標(biāo)簽,使用空格或tab隔開(kāi);
P53_collapsed_symbols.gct #基因表達(dá)譜數(shù)據(jù)
如果對(duì)下面數(shù)據(jù)格式有困惑的話,可以參考https://www.plob.org/article/12007.html


如果基因表達(dá)譜數(shù)據(jù)不是用gct格式而是使用txt格式的話,去掉前兩行即可,即文件第一行為NAME,DESCRIPTION,sample1,sample2...
接下來(lái)是表型數(shù)據(jù):

將數(shù)據(jù)導(dǎo)入GSEA
有三種方式可以導(dǎo)入,這里我們直接用第三種將文件拖進(jìn)來(lái)即可,只有顯示There were NO errors 才算成功。

導(dǎo)入數(shù)據(jù)之后,設(shè)置相應(yīng)的文件,Gene sets database可以按照自己想看的通路選擇合適的,并點(diǎn)擊run:

Error:分析出錯(cuò),點(diǎn)擊Error,查看出錯(cuò)詳情;
Success:分析成功,點(diǎn)擊Success,可以查看網(wǎng)頁(yè)報(bào)告;



參考:https://www.gsea-msigdb.org/gsea/doc/GSEAUserGuideFrame.html
https://www.cnblogs.com/nkwy2012/p/10258644.html