轉(zhuǎn)錄組差異分析流程三大R包比較

總目錄:

  1. 數(shù)據(jù)預(yù)處理
  2. limma包進(jìn)行差異分析
  3. edgeR包進(jìn)行差異分析
  4. DESeq2包進(jìn)行差異分析
  5. 三大R包比較

1.輸入數(shù)據(jù)比較

edgeR: 原始的count矩陣,支持單個(gè)樣品和重復(fù)樣品
DESeq2: 原始的count矩陣(htseq-count),只支持重復(fù)樣品
limma: 原始的count矩陣(需自己標(biāo)準(zhǔn)化,一定要log化)、經(jīng)過標(biāo)準(zhǔn)化的矩陣或芯片數(shù)據(jù),只支持重復(fù)樣品
注: 無重復(fù)RNAseq樣本推薦使用Gfold軟件進(jìn)行分析

2.性能比較

導(dǎo)入數(shù)據(jù)

load('edgeR_diff.Rdata')
edgeR<-diff_signif
load('limma_diff.Rdata')
limma<-diff_signif
oad('deseq2_diff.Rdata')
deseq2<-diff_signif

差異基因數(shù)目比較

dim(deseq2)
dim(limma)
dim(edgeR)

image.png

edgeR: 得到基因數(shù)目最多

DESeq2: 得到基因數(shù)目適中

limma: 得到基因數(shù)目最少

差異基因一致性比較

library('VennDiagram')
data=list(DEseq2=rownames(deseq2),edgeR=rownames(edgeR),limma=rownames(limma))
ve<-venn.diagram(data,filename = NULL,fill=c('red','yellow','blue'))
grid.draw(ve)

image.png

結(jié)論:

三個(gè)R包得到的差異基因數(shù)目差別不是很大
edgeR包和DEseq2包得到的差異基因更加相似
limma包得到的差異基因準(zhǔn)確率最高(其他兩個(gè)R包不能得到的差異基因數(shù)量最少,只占總數(shù)的2%),但假陰性高(實(shí)際差異結(jié)果不差異)
edgeR包能得到更多的差異基因,但假陽(yáng)性高(實(shí)際不差異結(jié)果差異)
運(yùn)行速度比較
計(jì)算從導(dǎo)入數(shù)據(jù)(16610基因,8樣本)到差異分析結(jié)束所需要的時(shí)間
limma: 3.944069 secs
edgeR: 5.882637 secs
DEseq2: 10.55145 secs
由此可見limma分析速度最快,DEseq2分析速度最慢

最后明確一個(gè)問題,三大R包用的什么標(biāo)準(zhǔn)化值來做的差異分析?他們用的是自己的標(biāo)準(zhǔn)化值。 那我想要用RPKM FPKM怎么辦?自己算!

————————————————

原文鏈接:https://blog.csdn.net/weixin_45161743/article/details/103536523

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容