TCGA基因表達(dá)數(shù)據(jù)和生存數(shù)據(jù)合并

打開臨床數(shù)據(jù)excel,分別自定義排序futime和fustat,futime中去掉生存天數(shù)為0和沒有的數(shù)據(jù),fustat中去掉無生存狀態(tài)的數(shù)據(jù)(1為死亡,0為存活)


臨床數(shù)據(jù)整理最終結(jié)果.png

將上圖數(shù)據(jù)全部復(fù)制粘貼到新建time.txt文件中


time.txt.png

輸入文件lncrnaPair.txt.png
library(limma)                #引用包
pairFile="lncrnaPair.txt"     #免疫lncRNA對文件
cliFile="time.txt"            #生存數(shù)據(jù)文件
setwd("E:\\Master research")    #設(shè)置工作目錄

#讀取表達(dá)文件,并對輸入文件整理
rt=read.table(pairFile, header=T, sep="\t", check.names=F)
rt=as.matrix(rt)
rownames(rt)=rt[,1]
exp=rt[,2:ncol(rt)]
dimnames=list(rownames(exp), colnames(exp))
data=matrix(as.numeric(as.matrix(exp)), nrow=nrow(exp), dimnames=dimnames)
data=avereps(data)

#刪掉正常樣品
group=sapply(strsplit(colnames(data),"\\-"),"[",4)
group=sapply(strsplit(group,""),"[",1)
group=gsub("2","1",group)
data=data[,group==0]
colnames(data)=gsub("(.*?)\\-(.*?)\\-(.*?)\\-(.*?)\\-.*", "\\1\\-\\2\\-\\3", colnames(data))
data=t(data)
data=avereps(data)

#讀取生存數(shù)據(jù)
cli=read.table(cliFile,sep="\t",check.names=F,header=T,row.names=1)     #讀取臨床文件

#數(shù)據(jù)合并并輸出結(jié)果
sameSample=intersect(row.names(data),row.names(cli))
data=data[sameSample,]
cli=cli[sameSample,]
out=cbind(cli,data)
out=cbind(id=row.names(out),out)
write.table(out,file="pairTime.txt",sep="\t",row.names=F,quote=F)
輸出文件.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容