limma差異分析

Q:該如何選擇limma, DESeq2, edgeR
A:各有各自應用的場景
  • 如果是芯片數(shù)據(jù),一般選擇limma,畢竟它是處理芯片數(shù)據(jù)之王。 不過edgeR也可以。芯片數(shù)據(jù)默認符合正態(tài)分布,而limma正是基于正態(tài)分布。
  • 如果是二代測序的原始count值,一般選擇DESeq或edgeR。注意這兩者只能處理count,不能處理FPKM等矯正后的數(shù)據(jù)。二代測序數(shù)據(jù)符合柏松分布,理論上不能用T檢驗,只能用非參數(shù)檢驗(秩和),但是統(tǒng)計力度不夠,所以還是得用經(jīng)過矯正后的參數(shù)檢驗。
  • 如果是FPKM等矯正后的表達量,可以用cuffdiff

Sum: 基于以上,對于二代測序數(shù)據(jù),先拿到原始count值進行DESeq2差異分析,再轉(zhuǎn)換成TPM進行下游分析。不建議用edgeR和cuffdiff。

edgeR的說明書,包括芯片數(shù)據(jù)

DESeq找差異基因+火山圖 傳送門:http://www.itdecent.cn/p/7c6a15eddfb6
今天寫的是limma進行差異分析。PS:limma的說明書實在太太太長了,不過卻是入門生信必讀的。

Step1: 準備數(shù)據(jù)
  1. group數(shù)據(jù)


    group分組信息
  2. 表達譜數(shù)據(jù)


Step2: 構(gòu)建design 樣本分組矩陣

library(limma)
design <- model.matrix(~0+group)
rownames(design) = colnames(expr1)
colnames(design) <- levels(group)

Step3: 構(gòu)建進行差異分析的對象

%構(gòu)建DGElist對象
DGElist <- DGEList(counts = expr1, group = group)
% 去除表達量過低的基因
% Compute counts per million (CPM)
keep_gene <- rowSums(cpm(DGElist) > 1) >= 2
table(keep_gene)
DGElist <- DGElist[keep_gene, ,keep.lib.sizes =FALSE]

Step4:構(gòu)建線性模型

% 計算列的矯正因子
DGElist <- calcNormFactors( DGElist )
% 將count值轉(zhuǎn)化成log2-counts per million (logCPM),準備進行線性回歸
v <- voom(DGElist, design, plot = TRUE, normalize = "quantile")
% 對每一個基因進行線性模型構(gòu)建
fit <- lmFit(v, design)
% 構(gòu)建比較矩陣
cont.matrix <- makeContrasts(contrasts = c('cancer-normal'), levels = design)
% 構(gòu)建芯片數(shù)據(jù)的線性模型,計算估計的相關(guān)系數(shù)和標準差
fit2 <- contrasts.fit(fit, cont.matrix)
% 基于貝葉斯計算T值,F(xiàn)值和log-odds
fit2 <- eBayes(fit2)

Step5:得出結(jié)果

nrDEG_limma_voom = topTable(fit2, coef = 'cancer-normal', n = Inf)
nrDEG_limma_voom = na.omit(nrDEG_limma_voom)
head(nrDEG_limma_voom)
% 篩選出符合要求的差異基因
library(dplyr)
res<-cbind(rownames(nrDEG_limma_voom),nrDEG_limma_voom)
res_1<-res %>% dplyr::filter((logFC>1 | logFC < (-1)) & adj.P.Val < 0.05)
colnames(res_1)[1]<-"Symbol"

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

  • 《相思》 相思二字重 難買相思意 但使無金錢 不讓相思起 《秋風》 無恨也無根 紅葉亂紛紛 蓮蓬已低頭 燈火已黃昏...
    賈sir先生閱讀 228評論 0 0
  • 雖說天秤們的日程表接近空白,如果沒有特別重要的事情,你也不可以占用他的時間太久。對天秤而言,和人在一起就會消...
    風箏的信仰閱讀 260評論 0 0
  • 看完《網(wǎng)絡迷蹤》,我想換個MACBOOK 昨天看了部另類的電影《網(wǎng)絡迷蹤》。 這部小成本電影,在2018年一月份,...
    怎一個強字了得閱讀 390評論 0 0
  • 我想每個人都有個西藏夢吧!上面的圖片就是在路上一個加油站遇到的。但是又覺得西藏離我們那么遠……那么遠……這個遠似乎...
    張小潔catherine閱讀 848評論 1 1

友情鏈接更多精彩內(nèi)容