學(xué)習(xí)教程來源于《手把手教你GEO數(shù)據(jù)庫差異基因分析》
本次學(xué)習(xí)筆記內(nèi)容為通過GEO2R在線工具進(jìn)行差異基因分析
通過了解,個(gè)人覺得這個(gè)方法相比R語言的優(yōu)勢(shì)是更普適性,以及更加“傻瓜”,方便學(xué)不明白R(shí)語言的同學(xué)。
第一步:同R語言,找到相關(guān)的數(shù)據(jù)集
第二步:點(diǎn)進(jìn)頁面詳情,進(jìn)行GEO2R在線分析
第三步:選擇分組信息,點(diǎn)擊分析
第四步:下載數(shù)據(jù),得到差異基因數(shù)據(jù)集,如果僅得到差異基因即可,可不進(jìn)行后續(xù)操作。
第五步:下載基因表達(dá)矩陣,查看矩陣信息,打開文檔,將多余信息刪除,留下geneid和各樣本表達(dá)量
第六步:通過excel可以篩選logFC>1或者<-1得基因,并可以篩選P<0.05得基因,本步可將無名字得基因數(shù)據(jù)篩出后刪除,清除無效信息即重復(fù)信息
第七步:重點(diǎn) 用excel打開數(shù)據(jù),將差異基因得geneid和genesymbol復(fù)制粘貼于表達(dá)矩陣得excel中,通過=vlookup(“geneid那列”2,$A$2:$$表達(dá)量得最后一列$樣本量,2,F(xiàn)ALSE)#這個(gè)命令就是通過將表達(dá)矩陣中得geneid與差異基因中得geneid匹配,進(jìn)而將genesymbol與樣本表達(dá)量匹配起來,得到數(shù)值后下拉全部框自動(dòng)充填,同一方法重復(fù)全部樣本。就此得到與genesymbol匹配得表達(dá)矩陣。#這個(gè)方法相比R語言更加好懂,更普適,但麻煩得多,適合剛開始接觸得同學(xué),有追求得同學(xué)可以去嘗試R語言,更加方便。