【表觀調控 實戰(zhàn)】四、目標基因表達量、相關性的可視化與繪圖

這里是佳奧,這一篇我們主要在IGV內進行可視化操作。

由于只是學習過程,這里的數(shù)據(jù)我拿上一次跑ChIP-Seq的.bw文件作為示例。


QQ截圖20220823204743.png

僅做例子。

1 IGV可視化

載入:.bw

選擇正確參考基因組。

輸入感興趣基因名稱,文章里的是pho。

右鍵樣本,使得尺度一致。


QQ截圖20220823205224.png

右鍵,Change Track Color,選擇改變的顏色。


QQ截圖20220823205459.png

2 目標基因表達量繪圖

幸運的是,往后部分有資料,那么我們就一步一步來吧。

資料來源

https://share.weiyun.com/5qmxu7Z
QQ截圖20220823205731.png

我們從第一步,gene-expression開始,數(shù)據(jù)來源就是all.counts.id,是RNA-Seq分析的結果文件。

##導入表達矩陣
rm(list = ls())
options(stringsAsFactors = F)
a=read.table('all.counts.id.txt',header = T)
dim(a)

##繪制表達量圖barplot
##第一個基因pho
cg=a[a[,1]=='pho',7:16]
library(ggpubr)
library(stringr)
dat=data.frame(gene=as.numeric(cg),
               sample=names(cg),
               group=str_split(names(cg),'_',simplify = T)[,1]
               )
ggbarplot(dat,x='sample',y='gene',color = 'group')
QQ截圖20220823211025.png
##第二個基因Spps
cg=a[a[,1]=='Spps',7:16]
library(ggpubr)
library(stringr)
dat=data.frame(gene=as.numeric(cg),
               sample=names(cg),
               group=str_split(names(cg),'_',simplify = T)[,1]
)
ggbarplot(dat,x='sample',y='gene',color = 'group')
QQ截圖20220823211936.png

后續(xù)還有需要調整的地方,比如把柱改成實心,具體顏色修改等。

3 多個基因相關性繪圖

導入數(shù)據(jù),第二步,check-correlation

rm(list = ls())
options(stringsAsFactors = F)
a=read.table('../figure-01-check-gene-expression//all.counts.id.txt',header = T)
dim(a)
dat=a[,7:16]

##需要把數(shù)據(jù)整理一下,有的在0,1附近,有的上萬,采用log(dat+1)

##各組間相關性
library(stringr)
ac=data.frame(group=str_split(colnames(dat),'_',simplify = T)[,1])
rownames(ac)=colnames(dat)
M=cor(log(dat+1))
pheatmap::pheatmap(M,
                   annotation_col = ac) 
QQ截圖20220823213046.png

相關性0.98,很高。

##內部相關性
pheatmap::pheatmap(scale(M),
                   annotation_col = ac) 
QQ截圖20220823213225.png
cg=dat[,colnames(dat)[grepl('_1',colnames(dat))]]
library(ggpubr)
cg=log(cg+1)
pairs(cg)
QQ截圖20220823225422.png

deeptools計算相關度(通過.bw文件計算)

##從.bw文件開始
multiBigwigSummary bins -b ../align/*.rmdup.bw -o results.npz -p 4

##繪制熱圖
plotCorrelation -in results.npz \
--corMethod spearman -- skipZeros \
--plotTitle "Spearman Correlation of Read Counts" \
--whatToPlot heatmap --colorMap RdYlBu --plotNumbers \
--plotFileFormat pdf \
-o heatmap_SpearmanCorr_readCounts.pdf \
--outFileCorMatrix SpearmanCorr_readCounts.tab
QQ截圖20220823230331.png

對結果不滿意可以把SpearmanCorr_readCounts.tab內容放到R用pheatmap函數(shù)來繪制熱圖:

##先在Linux內把SpearmanCorr_readCounts.tab另存為txt
less SpearmanCorr_readCounts.tab > tab.txt

##導入R繪制熱圖
txt <- read.table('tab.txt')
txt <- log(txt+1)
pheatmap::pheatmap(txt)
QQ截圖20220823231124.png

下一篇我們繼續(xù)尋找差異基因并可視化的內容。

我們下一篇再見!

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容