2022-10-01

昨天上午復(fù)習(xí)了前天學(xué)的知識(shí),隨后被Deep Learning與生信組合吸引了注意,不過看了一些文獻(xiàn)和公眾號(hào)推送,覺得還是不能太理解。

下午繼續(xù)寫開題報(bào)告,下載了很多關(guān)于蛋白質(zhì)組學(xué)的畢業(yè)論文,理清了思路,大概完成了框架。

晚上開始學(xué)習(xí)生信,昨天主要是一些代碼的學(xué)習(xí)。

GEO數(shù)據(jù)的下載和提?。ㄕ∽陨偶寄軜洌?/p>

#數(shù)據(jù)下載

rm(list = ls())

options(stringsAsFactors = F)

library(GEOquery)

gse = "GSE42872"

eSet <- getGEO(gse,

?????????????? destdir = '.',(下載到當(dāng)前目錄)

?????????????? getGPL = F)(不要注釋文件)

#(1)提取表達(dá)矩陣exp

exp <- exprs(eSet[[1]])

exp[1:4,1:4] (這里主要是為了看數(shù)據(jù),是不是log后的,可以range看范圍)

#exp = log2(exp+1)

#(2)提取臨床信息

pd <- pData(eSet[[1]])

#(3)調(diào)整pd的行名順序與exp列名完全一致(這步很重要,如果落下了后面的分析全錯(cuò))

p = identical(rownames(pd),colnames(exp));p

if(!p) exp =exp[,match(rownames(pd),colnames(exp))]

#(4)提取芯片平臺(tái)編號(hào)

gpl <- eSet[[1]]@annotation

save(gse,pd,exp,gpl,file ="step1output.Rdata")

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容