GEO數(shù)據(jù)挖掘?qū)W習(xí)筆記二

學(xué)習(xí)教程來源于《手把手教你GEO數(shù)據(jù)庫差異基因分析》

本次學(xué)習(xí)筆記內(nèi)容為通過GEO2R在線工具進(jìn)行差異基因分析

通過了解,個(gè)人覺得這個(gè)方法相比R語言的優(yōu)勢(shì)是更普適性,以及更加“傻瓜”,方便學(xué)不明白R(shí)語言的同學(xué)。

第一步:同R語言,找到相關(guān)的數(shù)據(jù)集

第二步:點(diǎn)進(jìn)頁面詳情,進(jìn)行GEO2R在線分析

第三步:選擇分組信息,點(diǎn)擊分析

第四步:下載數(shù)據(jù),得到差異基因數(shù)據(jù)集,如果僅得到差異基因即可,可不進(jìn)行后續(xù)操作。

第五步:下載基因表達(dá)矩陣,查看矩陣信息,打開文檔,將多余信息刪除,留下geneid和各樣本表達(dá)量

第六步:通過excel可以篩選logFC>1或者<-1得基因,并可以篩選P<0.05得基因,本步可將無名字得基因數(shù)據(jù)篩出后刪除,清除無效信息即重復(fù)信息

第七步:重點(diǎn) 用excel打開數(shù)據(jù),將差異基因得geneid和genesymbol復(fù)制粘貼于表達(dá)矩陣得excel中,通過=vlookup(“geneid那列”2,$A$2:$$表達(dá)量得最后一列$樣本量,2,F(xiàn)ALSE)#這個(gè)命令就是通過將表達(dá)矩陣中得geneid與差異基因中得geneid匹配,進(jìn)而將genesymbol與樣本表達(dá)量匹配起來,得到數(shù)值后下拉全部框自動(dòng)充填,同一方法重復(fù)全部樣本。就此得到與genesymbol匹配得表達(dá)矩陣。#這個(gè)方法相比R語言更加好懂,更普適,但麻煩得多,適合剛開始接觸得同學(xué),有追求得同學(xué)可以去嘗試R語言,更加方便。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容