MCPcounter實戰(zhàn)點點滴滴

第一

我得到的數(shù)據(jù)是nrpm值,處理的方法如下??紤]了管家基因后的normalization。然后limma做差異分析。


image.png

image.png

我的問題:能不能使用原始read counts數(shù)據(jù)用DEseq2做normalization?(DEseq2做normilization時需要使用為整數(shù)的read counts,不然會報錯
回答:DEseq2做normalization時沒有考慮到管家基因,所以不建議用此方法

第二

我自己在給我的數(shù)據(jù)nrpm上直接做了PCA圖:nrpm數(shù)據(jù)格式和PCA圖如下:

由于數(shù)據(jù)差異較大,PCA圖不是特別好看,所以建議可以Zscore或者logratio再次進行歸一化。代碼參考http://www.itdecent.cn/p/57f62efa0fab

b<- scale(expr)
a<- log(expr+1)
########zscore就是scale

第三

需要研究一下MCPcount是需要read counts還是可以用normalization的值
但是Xcell寫的很明確,read counts或者normalization的值都可以,因為它只做ranking


MCPcounter方法學原文中使用TCGA數(shù)據(jù)庫驗證時,使用了normalized results。所以解釋了我的疑問。
查考文章:Estimating the population abundance of tissue-infiltrating immune and stromal cell populations using gene expression

image.png

MCP counter和cibersort最大的區(qū)別就是cibersort是計算淋巴細胞的比例,二MCPcounter是一個決定計數(shù)方法。

第四

我自己的數(shù)據(jù)表明

Primary tumor
image.png
image.png

Metastasis lesion

image.png
image.png

參考文章Estimating the population abundance of tissue-infiltrating immune and stromal cell populations using gene expression
此文章對Lung Adenocarcinoma的數(shù)據(jù)進行了分析發(fā)現(xiàn),將患者分成四組Blinegae 和Tcell 高表達的患者預后最好,我們的數(shù)據(jù)有一樣的發(fā)現(xiàn)!!奠定了這一篇文章的基礎。
后續(xù)我也會將分組信息變成四組進行分析

image.png

第五

MCPcounter進行TCGA數(shù)據(jù)挖掘的方法

只需要構建一個表達矩陣:colname是sample_name,rownames是基因symbol或者另外兩個ID(不記得了)featuresType=c("HUGO_symbols")其實有三種可選

代碼如下

library(curl)
library(MCPcounter)
??MCPcounter.estimate
load(file = 'TCGA.Rdata')
exprMatrix[1:10,1:10]####################ensemble整潔版ID
####library(clusterProfiler)
library(org.Hs.eg.db)
ls("package:org.Hs.eg.db")
g2s=toTable(org.Hs.egSYMBOL);head(g2s)
g2e=toTable(org.Hs.egENSEMBL);head(g2e)
tmp=merge(g2e,g2s,by='gene_id')
head(tmp)
colnames(exprMatrix)[ncol(exprMatrix)] <- c("ensembl_id")###################重命名Ensemble_ID 便于后面merge
exprMatrix<- merge(tmp,exprMatrix,by='ensembl_id')
exprMatrix<- exprMatrix[,- c(1,2)]
exprMatrix=exprMatrix[!duplicated(exprMatrix$symbol),]
row.names(exprMatrix)<- exprMatrix[,1]
exprMatrix<- exprMatrix[,-1]
probesets=read.table(curl("http://raw.githubusercontent.com/ebecht/MCPcounter/master/Signatures/probesets.txt"),sep="\t",stringsAsFactors=FALSE,colClasses="character")
genes=read.table(curl("http://raw.githubusercontent.com/ebecht/MCPcounter/master/Signatures/genes.txt"),sep="\t",stringsAsFactors=FALSE,header=TRUE,colClasses="character",check.names=FALSE)
results<- MCPcounter.estimate(exprMatrix,featuresType=c("HUGO_symbols")[1],
                    probesets=probesets,
                    genes=genes
)
第五

修改生存曲線圖例legend 參考資料:
http://www.sthda.com/english/wiki/survminer-r-package-survival-data-analysis-and-visualization
待續(xù)。。。。。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容