這里是佳奧,這一篇我們主要在IGV內進行可視化操作。
由于只是學習過程,這里的數(shù)據(jù)我拿上一次跑ChIP-Seq的.bw文件作為示例。

QQ截圖20220823204743.png
僅做例子。
1 IGV可視化
載入:.bw
選擇正確參考基因組。
輸入感興趣基因名稱,文章里的是pho。
右鍵樣本,使得尺度一致。

QQ截圖20220823205224.png
右鍵,Change Track Color,選擇改變的顏色。

QQ截圖20220823205459.png
2 目標基因表達量繪圖
幸運的是,往后部分有資料,那么我們就一步一步來吧。
資料來源
https://share.weiyun.com/5qmxu7Z

QQ截圖20220823205731.png
我們從第一步,gene-expression開始,數(shù)據(jù)來源就是all.counts.id,是RNA-Seq分析的結果文件。
##導入表達矩陣
rm(list = ls())
options(stringsAsFactors = F)
a=read.table('all.counts.id.txt',header = T)
dim(a)
##繪制表達量圖barplot
##第一個基因pho
cg=a[a[,1]=='pho',7:16]
library(ggpubr)
library(stringr)
dat=data.frame(gene=as.numeric(cg),
sample=names(cg),
group=str_split(names(cg),'_',simplify = T)[,1]
)
ggbarplot(dat,x='sample',y='gene',color = 'group')

QQ截圖20220823211025.png
##第二個基因Spps
cg=a[a[,1]=='Spps',7:16]
library(ggpubr)
library(stringr)
dat=data.frame(gene=as.numeric(cg),
sample=names(cg),
group=str_split(names(cg),'_',simplify = T)[,1]
)
ggbarplot(dat,x='sample',y='gene',color = 'group')

QQ截圖20220823211936.png
后續(xù)還有需要調整的地方,比如把柱改成實心,具體顏色修改等。
3 多個基因相關性繪圖
導入數(shù)據(jù),第二步,check-correlation
rm(list = ls())
options(stringsAsFactors = F)
a=read.table('../figure-01-check-gene-expression//all.counts.id.txt',header = T)
dim(a)
dat=a[,7:16]
##需要把數(shù)據(jù)整理一下,有的在0,1附近,有的上萬,采用log(dat+1)
##各組間相關性
library(stringr)
ac=data.frame(group=str_split(colnames(dat),'_',simplify = T)[,1])
rownames(ac)=colnames(dat)
M=cor(log(dat+1))
pheatmap::pheatmap(M,
annotation_col = ac)

QQ截圖20220823213046.png
相關性0.98,很高。
##內部相關性
pheatmap::pheatmap(scale(M),
annotation_col = ac)

QQ截圖20220823213225.png
cg=dat[,colnames(dat)[grepl('_1',colnames(dat))]]
library(ggpubr)
cg=log(cg+1)
pairs(cg)

QQ截圖20220823225422.png
deeptools計算相關度(通過.bw文件計算)
##從.bw文件開始
multiBigwigSummary bins -b ../align/*.rmdup.bw -o results.npz -p 4
##繪制熱圖
plotCorrelation -in results.npz \
--corMethod spearman -- skipZeros \
--plotTitle "Spearman Correlation of Read Counts" \
--whatToPlot heatmap --colorMap RdYlBu --plotNumbers \
--plotFileFormat pdf \
-o heatmap_SpearmanCorr_readCounts.pdf \
--outFileCorMatrix SpearmanCorr_readCounts.tab

QQ截圖20220823230331.png
對結果不滿意可以把SpearmanCorr_readCounts.tab內容放到R用pheatmap函數(shù)來繪制熱圖:
##先在Linux內把SpearmanCorr_readCounts.tab另存為txt
less SpearmanCorr_readCounts.tab > tab.txt
##導入R繪制熱圖
txt <- read.table('tab.txt')
txt <- log(txt+1)
pheatmap::pheatmap(txt)

QQ截圖20220823231124.png
下一篇我們繼續(xù)尋找差異基因并可視化的內容。
我們下一篇再見!