不用編程也可以做GSEA

GSEA的原理可參考:https://cloud.tencent.com/developer/article/1426130

下載GSEA軟件

根據(jù)自己電腦內(nèi)存大小下載適合的版本:https://www.gsea-msigdb.org/gsea/downloads.jsp
1.準(zhǔn)備輸入數(shù)據(jù)
輸入數(shù)據(jù)如果是RNAseq的話,需要準(zhǔn)備基因的表達(dá)矩陣和表型數(shù)據(jù)。格式如下面的例子所示:
Example Datasets(http://software.broadinstitute.org/gsea/datasets.jsp)
以P53突變樣本為例:

下載P53的表型數(shù)據(jù)(cls文件)和基因表達(dá)數(shù)據(jù)(gct文件)
GSEA軟件其他需要的數(shù)據(jù)格式可參考:GSEA軟件支持的數(shù)據(jù)格式
P53.cls #表型文件,定義了表達(dá)文檔中樣品的表型標(biāo)簽,使用空格或tab隔開(kāi);
P53_collapsed_symbols.gct #基因表達(dá)譜數(shù)據(jù)
如果對(duì)下面數(shù)據(jù)格式有困惑的話,可以參考https://www.plob.org/article/12007.html

為了看起來(lái)整齊一些用excel打開(kāi)表達(dá)矩陣大概是這個(gè)樣子的數(shù)據(jù):

如果基因表達(dá)譜數(shù)據(jù)不是用gct格式而是使用txt格式的話,去掉前兩行即可,即文件第一行為NAME,DESCRIPTION,sample1,sample2...
接下來(lái)是表型數(shù)據(jù):


將數(shù)據(jù)導(dǎo)入GSEA
有三種方式可以導(dǎo)入,這里我們直接用第三種將文件拖進(jìn)來(lái)即可,只有顯示There were NO errors 才算成功。

導(dǎo)入數(shù)據(jù)之后,設(shè)置相應(yīng)的文件,Gene sets database可以按照自己想看的通路選擇合適的,并點(diǎn)擊run:



Error:分析出錯(cuò),點(diǎn)擊Error,查看出錯(cuò)詳情;
Success:分析成功,點(diǎn)擊Success,可以查看網(wǎng)頁(yè)報(bào)告;



參考:https://www.gsea-msigdb.org/gsea/doc/GSEAUserGuideFrame.html
https://www.cnblogs.com/nkwy2012/p/10258644.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容