ChIP-seq 分析:Peak 注釋與可視化(9)

1. 基因注釋

到目前為止,我們一直在處理對(duì)應(yīng)于轉(zhuǎn)錄因子結(jié)合的 ChIPseq 峰。顧名思義,轉(zhuǎn)錄因子可以影響其靶基因的表達(dá)。

轉(zhuǎn)錄因子的目標(biāo)很難單獨(dú)從 ChIPseq 數(shù)據(jù)中確定,因此我們通常會(huì)通過一組簡單的規(guī)則來注釋基因的峰:

如果峰與基因重疊,則通常將峰注釋為基因。

2. Peak 注釋

ChIPseeker 是一個(gè)有用的基因峰注釋包。通過在小鼠 TXDB 對(duì)象(mm10 基因組)的來源中使用預(yù)定義的注釋,ChIPseeker 將為我們提供峰落在基因中的位置以及到 TSS 位點(diǎn)的距離的概覽。

首先加載下一部分所需的庫。

library(TxDb.Mmusculus.UCSC.mm10.knownGene)
library(org.Mm.eg.db)
library(GenomeInfoDb)
library(ChIPseeker)

annotatePeak 函數(shù)接受要注釋的區(qū)域的 GRanges 對(duì)象、基因位置的 TXDB 對(duì)象和要從中檢索基因名稱的數(shù)據(jù)庫對(duì)象名稱。

peakAnno <- annotatePeak(macsPeaks_GR, tssRegion = c(-500, 500), TxDb = TxDb.Mmusculus.UCSC.mm10.knownGene,
    annoDb = "org.Mm.eg.db")
peakAnno <- annotatePeak(macsPeaks_GR, tssRegion = c(-500, 500), TxDb = TxDb.Mmusculus.UCSC.mm10.knownGene,
class(peakAnno)
peakAnno

結(jié)果是一個(gè)包含峰注釋和整體注釋統(tǒng)計(jì)信息的 csAnno 對(duì)象。

peakAnno
peakAnno

csAnno 對(duì)象包含有關(guān)基因的單個(gè)峰的注釋信息。要從 csAnno 對(duì)象中提取它,ChIPseeker 函數(shù) as.GRanges 或 as.data.frame 可用于生成具有峰及其相關(guān)基因的相應(yīng)對(duì)象。

peakAnno_GR <- as.GRanges(peakAnno)
peakAnno_DF <- as.data.frame(peakAnno)
peakAnno_GR[1:2, ]
peakAnno_GR

3. 可視化 Peak 注釋

現(xiàn)在我們有了來自 ChIPseeker 的注釋峰,我們可以使用 ChIPseeker 的一些繪圖功能來顯示基因特征中峰的分布。在這里,我們使用 plotAnnoBar 函數(shù)將其繪制為條形圖,但 plotAnnoPie 會(huì)生成類似于餅圖的圖。

plotAnnoBar(peakAnno)
plotAnnoBar

同樣,我們可以繪制 TSS 站點(diǎn)周圍峰值的分布。

plotDistToTSS(peakAnno)
plotDistToTSS

ChIPseeker 還可以提供一個(gè)簡潔的圖來描述注釋之間的重疊。

upsetplot(peakAnno, vennpie = F)
upsetplot

本文由mdnice多平臺(tái)發(fā)布

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容