ESTIMATE腫瘤純度預(yù)測

腫瘤純度:是指腫瘤組織中腫瘤細(xì)胞所占的比例。
腫瘤組織中除了腫瘤細(xì)胞之外還有免疫細(xì)胞、基質(zhì)細(xì)胞、間質(zhì)細(xì)胞等非腫瘤細(xì)胞,共同影響腫瘤發(fā)生發(fā)展。
研究顯示腫瘤純度與腫瘤患者的臨床特征、基因組表達(dá)和生物學(xué)特性均顯著相關(guān),忽視腫瘤純度的影響可導(dǎo)致腫瘤基因分型、復(fù)發(fā)風(fēng)險(xiǎn)及療效預(yù)測等過程產(chǎn)生系統(tǒng)性偏倚。

計(jì)算腫瘤純度用estmate包。
以下是具體教程。

##estimate估計(jì)腫瘤的TNM分期,也就是腫瘤的純度。
##安裝estimate包
library(utils)
rforge <- "http://r-forge.r-project.org"
install.packages("estimate", repos=rforge, dependencies=TRUE)

library(estimate)
setwd("E:/8資料/2.干細(xì)胞/5.TNM分期")
#dat <- read.table("RNAmatrix_symble.txt", header=TRUE, row.names = 1)
#Error in read.table("RNAmatrix_symble.txt", header = TRUE, row.names = 1) : 
#  'row.names'里不能有重復(fù)的名字

dat <- read.table("RNAmatrix_symble.txt", header=TRUE)
rows <- rownames(unique(dat['GeneSymbol']))
dat <- dat[rows,]
rownames(dat) <- dat[,1]
dat <- dat[,-1]
dat[1:4,1:4]
write.table(dat, file="RNAmatrix_symble_noDuplicate.txt", quote=FALSE, sep = "\t")
##打開RNAmatrix_symble_noDuplicate.txt后,將第一列的名字改成GeneSymbol。

filterCommonGenes(input.f= "RNAmatrix_symble_noDuplicate.txt" , output.f="LH_genes.gct",
                  id="GeneSymbol")

estimateScore(input.ds ="LH_genes.gct",output.ds="LH_estimate_score.gct",
              platform="affymetrix")#platform默認(rèn)是affymetrix。     


#默認(rèn)就是對所有樣本繪制圖形
#圖形將保存至estimated_purity_plots目錄下。
plotPurity(scores="LH_estimate_score.gct",samples="TCGA.A2L6", platform="affymetrix")##只對其中一個樣品繪圖。
plotPurity(scores="LH_estimate_score.gct", platform="affymetrix")##對所有樣品繪圖。

#當(dāng)然我們可以直接對我們最后的結(jié)果進(jìn)行讀出并提取我們想要的數(shù)據(jù):
scores <- read.table("LH_estimate_score.gct",skip= 2,header = T)
head(scores)              
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容