R語(yǔ)言操作GTEx數(shù)據(jù)庫(kù)中g(shù)ct大文件

01072019 更新

所以說(shuō)單位發(fā)了一個(gè)頂配的Mac Pro,然后隨意Run了下,輕松讀進(jìn)去了。

rt<-read.table("GTEx_Analysis_2016-01-15_v7_RNASeQCv1.1.8_gene_tpm.gct", skip = 2, header = TRUE, sep = "\t")

=============

GTEx數(shù)據(jù)庫(kù)不用多說(shuō),我下載下來(lái)了表達(dá)數(shù)據(jù)為gct格式文件但是特別大,怎么辦。腳本語(yǔ)言perl和python都剛學(xué)還不會(huì),所以就準(zhǔn)備用R來(lái)操作。

我的目的非常簡(jiǎn)單,提取GTEx中肝組織的表達(dá)數(shù)據(jù)。因此我下載了gct的表達(dá)數(shù)據(jù),和組織的生物學(xué)信息從中獲取了liver組織的ID。下載網(wǎng)址為:https://gtexportal.org/home/datasets

要注意代碼中,ID編號(hào)的連接符的一致性因?yàn)镽會(huì)默認(rèn)把列名中的連接符-變?yōu)?,所以要注意替換 或者要加上check.names=F。

我使用了兩個(gè)文件:liver.csv這里是肝細(xì)胞的ID,從GTEx下載的數(shù)據(jù)提取出來(lái)的,GTEx_Analysis_2016-01-15_v7_RNASeQCv1.1.8_gene_tpm.gct這個(gè)是GTEx下載的表達(dá)數(shù)據(jù)。

我參考了這個(gè)教程:https://blog.csdn.net/u012432611/article/details/50224015

然后自己寫了個(gè)循環(huán)構(gòu)建了classes變量。

liverid<-read.csv("liver.csv",header=T)

liverid<-as.character(liverid[,1])

rt<-read.table("GTEx_Analysis_2016-01-15_v7_RNASeQCv1.1.8_gene_tpm.gct", skip = 2, header = TRUE, sep = "\t",nrow=5,check.names=F)

liverid<-intersect(colnames(rt),liverid)

c<-vector()

a<-colnames(rt)

for (i in 1:length(liverid)){

? b<-which(a==liverid[i])

? c<-c(c,b)

}

d<-c

classes <- sapply(rt, class)

classes[d] <- rep("NULL", length(classes)-length(d))

rtt<-read.table("GTEx_Analysis_2016-01-15_v7_RNASeQCv1.1.8_gene_tpm.gct", skip = 2, header = TRUE, sep = "\t",colClasses=classes, check.names=F)

write.csv(rtt,"liver_GTEx_expression.csv")

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • http://blog.sina.com.cn/s/blog_6bc5205e0102vma9.html inst...
    付德剛Q閱讀 3,220評(píng)論 0 3
  • 2.軟件以及流程以及代碼: 本實(shí)驗(yàn)使用常規(guī)的Tophat2 比對(duì) (1)樣本制備、建庫(kù):總RNA ---> pol...
    我最有才閱讀 25,176評(píng)論 0 27
  • 1.R畫圖 R是我們做生信進(jìn)行圖形展示較為常用的軟件,我們?cè)诮?jīng)常使用R進(jìn)行數(shù)據(jù)展示,畫一個(gè)或者幾個(gè)圖,但我們做生信...
    堯小飛閱讀 7,617評(píng)論 0 12
  • 晨霧浮起,我想起荷塘中的你 孩童般在酣睡 也令我陶醉 曦熏風(fēng)醞 空中滿是你的氣息 微苦 清麗 在夏午使我清醒 月上...
    彥澤閱讀 160評(píng)論 0 0
  • 曾經(jīng)以為,我是一個(gè)很成功的家長(zhǎng),但當(dāng)青春期的女兒開(kāi)始反抗,我也沒(méi)覺(jué)得自己做錯(cuò)什么,全部歸于孩子逆反,不聽(tīng)話...
    陽(yáng)光_722f閱讀 566評(píng)論 2 14

友情鏈接更多精彩內(nèi)容