1. 基因注釋
到目前為止,我們一直在處理對(duì)應(yīng)于轉(zhuǎn)錄因子結(jié)合的 ChIPseq 峰。顧名思義,轉(zhuǎn)錄因子可以影響其靶基因的表達(dá)。
轉(zhuǎn)錄因子的目標(biāo)很難單獨(dú)從 ChIPseq 數(shù)據(jù)中確定,因此我們通常會(huì)通過一組簡單的規(guī)則來注釋基因的峰:
如果峰與基因重疊,則通常將峰注釋為基因。
2. Peak 注釋
ChIPseeker 是一個(gè)有用的基因峰注釋包。通過在小鼠 TXDB 對(duì)象(mm10 基因組)的來源中使用預(yù)定義的注釋,ChIPseeker 將為我們提供峰落在基因中的位置以及到 TSS 位點(diǎn)的距離的概覽。
首先加載下一部分所需的庫。
library(TxDb.Mmusculus.UCSC.mm10.knownGene)
library(org.Mm.eg.db)
library(GenomeInfoDb)
library(ChIPseeker)
annotatePeak 函數(shù)接受要注釋的區(qū)域的 GRanges 對(duì)象、基因位置的 TXDB 對(duì)象和要從中檢索基因名稱的數(shù)據(jù)庫對(duì)象名稱。
peakAnno <- annotatePeak(macsPeaks_GR, tssRegion = c(-500, 500), TxDb = TxDb.Mmusculus.UCSC.mm10.knownGene,
annoDb = "org.Mm.eg.db")

class(peakAnno)

結(jié)果是一個(gè)包含峰注釋和整體注釋統(tǒng)計(jì)信息的 csAnno 對(duì)象。
peakAnno

csAnno 對(duì)象包含有關(guān)基因的單個(gè)峰的注釋信息。要從 csAnno 對(duì)象中提取它,ChIPseeker 函數(shù) as.GRanges 或 as.data.frame 可用于生成具有峰及其相關(guān)基因的相應(yīng)對(duì)象。
peakAnno_GR <- as.GRanges(peakAnno)
peakAnno_DF <- as.data.frame(peakAnno)
peakAnno_GR[1:2, ]

3. 可視化 Peak 注釋
現(xiàn)在我們有了來自 ChIPseeker 的注釋峰,我們可以使用 ChIPseeker 的一些繪圖功能來顯示基因特征中峰的分布。在這里,我們使用 plotAnnoBar 函數(shù)將其繪制為條形圖,但 plotAnnoPie 會(huì)生成類似于餅圖的圖。
plotAnnoBar(peakAnno)

同樣,我們可以繪制 TSS 站點(diǎn)周圍峰值的分布。
plotDistToTSS(peakAnno)

ChIPseeker 還可以提供一個(gè)簡潔的圖來描述注釋之間的重疊。
upsetplot(peakAnno, vennpie = F)

本文由mdnice多平臺(tái)發(fā)布