由于基因表達(dá)調(diào)控機制的復(fù)雜性,多種組學(xué)數(shù)據(jù)的整合分析,從不同的層面探究生物問題越來越重要。從RNA-Seq層面,我們可以探究哪些基因具有顯著差異,上調(diào)或下調(diào);從ChIP-Seq層面,我們可以研究某個特定轉(zhuǎn)錄因子的調(diào)控作用;從ATAC-Seq我們可以了解到染色質(zhì)可及性的動態(tài)變化,由于染色質(zhì)的可及性與調(diào)控元件或轉(zhuǎn)錄因子的結(jié)合密切相關(guān),在轉(zhuǎn)錄調(diào)控中發(fā)揮著重要的作用。因此,整合分析可以進(jìn)一步探究調(diào)控某一生物學(xué)過程的關(guān)鍵因子(包括順式調(diào)控元件和轉(zhuǎn)錄因子),以及哪個轉(zhuǎn)錄因子調(diào)控了感興趣的基因,以及感興趣的轉(zhuǎn)錄因子的靶基因等。
目前,好像并沒有標(biāo)準(zhǔn)化的方法用來整合比較這三種數(shù)據(jù)。不過在文獻(xiàn)中可以看到有很多相同的或不同的思路和方法做整合分析,大家可以在學(xué)習(xí)交流群中推薦文獻(xiàn),一起解讀學(xué)習(xí)。
下面的內(nèi)容主要介紹這一節(jié)課程中RNA-Seq和ChIP-Seq的整合分析中提到的兩種方法:
一是直接比較,即首先得到差異基因與ChIP-Seq靶基因的overlap,然后選擇一些關(guān)鍵基因比較一下譜圖。

課程中提到的另一種方法是使用BETA工具:
BETA (Binding and Expression Target Analysis)是 Shirley Liu實驗室開發(fā)的工具,通過整合轉(zhuǎn)錄因子或染色質(zhì)調(diào)控因子的ChIP-Seq與差異基因的表達(dá)直接預(yù)測靶基因,而且有可能發(fā)現(xiàn)增強子區(qū)的蛋白質(zhì)的靶基因。
BETA有三個功能:
- 預(yù)測轉(zhuǎn)錄因子的功能是激活還是抑制
- 預(yù)測轉(zhuǎn)錄因子的靶基因
- 鑒定轉(zhuǎn)錄因子的motif以及調(diào)控轉(zhuǎn)錄因子激活或抑制的其他因子
BETA包括三個命令取決于輸入數(shù)據(jù)格式和想要的輸出數(shù)據(jù)(可以參考嘉因的帖子ChIP-seq和RNA-seq整合分析,BETA最擅長 | 自己分析數(shù)據(jù)的完美解決方案)
- BETA basic: 預(yù)測轉(zhuǎn)錄因子的功能是激活還是抑制,直接檢測靶標(biāo)
- BETA plus:BETA basic + 靶標(biāo)區(qū)域的motif分析
- BETA minus:只基于結(jié)合數(shù)據(jù)的調(diào)控潛能的值預(yù)測TF靶基因

工作原理
- 每個基因的調(diào)控潛能值是通過計算基因TSS的指定范圍內(nèi)的所有結(jié)合位點來計算的
- 調(diào)控潛能是基因受因子調(diào)節(jié)的可能性,取決于TSS范圍的結(jié)合位點數(shù)以及與結(jié)合位點與TSS之間的距離
- BETA minus按照調(diào)控潛能值對基因排序來鑒定靶標(biāo)
- BETA basic需要特定格式的差異分析結(jié)果和顯著性的結(jié)果。它使用CDF來判斷上調(diào)基因和下調(diào)基因是否與NON-DE不同,這是用來識別激活和抑制功能。使用調(diào)控潛能和差異統(tǒng)計量計算每一個基因的得分排序,該得分排序可以用于識別靶標(biāo)。