ncHMR detector: a computational framework to systematically reveal non- classical functions of histone modification regulators 閱讀總結(jié)
覺得太長不看可以直接跳到研究思路部分
前言
HMRs(Histone modification regulators)為組蛋白修飾調(diào)節(jié)因子,它可以識別、添加、去除蛋白尾端的修飾(甲基化、乙酰化、磷酸化、腺苷酸化、泛素化等),一般來說HMRs會依據(jù)其功能會被認(rèn)為是組蛋白修飾的readers(識別者), writers(寫入者)或者是erasers(擦除者)。
大量的研究證明了HMRs可以導(dǎo)致多種類型的疾病,并且部分HMRs也被證明可以成為治療靶點(diǎn),一般來說其作用重要在于對染色質(zhì)狀態(tài)與基因表達(dá)的調(diào)節(jié),而以上提及的作用被認(rèn)為是HMRs的經(jīng)典功能(Classical functions);同時(shí)也有文獻(xiàn)報(bào)道HMRs可以不依賴于它們已知的組蛋白修飾底物或者產(chǎn)物,與一些輔因子協(xié)作行使非經(jīng)典功能(Non-Classical functions):
- PCR2復(fù)合體可以通過甲基化轉(zhuǎn)移酶EZH1/2催化H3K27的二甲基或者三甲基化,但是12年SCIENCE上[Shirley Liu](https://www.ncbi.nlm.nih.gov/pubmed/?term=Liu XS[Author]&cauthor=true&cauthor_uid=23239736)和[Myles Brown](https://www.ncbi.nlm.nih.gov/pubmed/?term=Brown M[Author]&cauthor=true&cauthor_uid=23239736)報(bào)道了EZH2可以不依賴PCR2復(fù)合體獨(dú)立的與雄激素受體(androgen receptor)結(jié)合并且激活下游基因
- SETDB1,一個(gè)組蛋白甲基化轉(zhuǎn)移酶,其經(jīng)典功能為催化H3K9的三甲基化,但是在Genome Res上[Shou J](https://www.ncbi.nlm.nih.gov/pubmed/?term=Shou J[Author]&cauthor=true&cauthor_uid=26160163)和 [Zhang Y](https://www.ncbi.nlm.nih.gov/pubmed/?term=Zhang Y[Author]&cauthor=true&cauthor_uid=26160163)報(bào)道了SETDB1在mESCs( mouse embryonic stem cells)中可以不依賴于H3K9me3調(diào)節(jié)PCR2復(fù)合體對發(fā)育基因的活性
目前對于HMRs的鑒定方法較為多樣:
- 通過鏈霉親和素磁珠對蛋白進(jìn)行分離,隨后進(jìn)行質(zhì)譜分析找到非經(jīng)典功能
- PCR1復(fù)合體(負(fù)責(zé)催化H2A的單泛素化H2Aub1)的核心單位RNF2,可以通過與KDM1A結(jié)合發(fā)揮其非經(jīng)典功能Mol Cell Proteomics
- 中等通量
- 使用ChIP配合western blot找到結(jié)合蛋白,ChIP-qPCR技術(shù)進(jìn)行驗(yàn)證下游基因
- H3K9me3和H3K36me3的去甲基化轉(zhuǎn)移酶KDM4B,可以結(jié)合MLL復(fù)合體調(diào)節(jié)乳腺癌相關(guān)基因Proc Natl Acad Sci U S A
- 低通量
- 通過對ChIP-seq數(shù)據(jù)的聯(lián)合分析,集中關(guān)注HMRs的結(jié)合位點(diǎn)同時(shí)這些位點(diǎn)沒有底物或產(chǎn)物的信號
- ChIP-seq技術(shù)被廣泛的應(yīng)用于尋找轉(zhuǎn)錄因子(Transcription Factors),染色質(zhì)調(diào)控子(Chromatin regulators),組蛋白修飾(Histone Modifications)在全基因組的結(jié)合位點(diǎn),提供了大量的結(jié)合位點(diǎn)可用以定義HMRs
- 優(yōu)點(diǎn):高通量
下圖展示了以上三種鑒定方法對應(yīng)的研究成果
overview
本文的研究痛點(diǎn)目前還沒有針對ncHMRs的計(jì)算工具
- 一個(gè)標(biāo)準(zhǔn)的ChIP-seq數(shù)據(jù)會擁有數(shù)以千計(jì)的peaks,而這與實(shí)驗(yàn)的質(zhì)量關(guān)系很大,通常來說實(shí)驗(yàn)中很難避免某些區(qū)域作用底物或者產(chǎn)物的信號丟失,導(dǎo)致會被錯(cuò)認(rèn)為行使非經(jīng)典功能的輔因子
- 公共數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量千差萬別,需要嚴(yán)格的自控才可以保證數(shù)據(jù)的可依賴性
- 為了利用目前公共數(shù)據(jù)庫,需要一個(gè)新的計(jì)算框架去解決以上的問題
本文的研究亮點(diǎn)開發(fā)出了ncHMR detector(non-classical functions of histone modification regulator detector),用以預(yù)測HMR的非經(jīng)典功能及其互作的輔因子
- ncHMR detector有一個(gè)篩選功能,包括需要非經(jīng)典功能輔因子的高密度結(jié)合與經(jīng)典底物或產(chǎn)物的結(jié)合信號缺失這兩個(gè)條件以減少假陽性的可能
- ncHMR detector使用嚴(yán)格的質(zhì)控保證數(shù)據(jù)的可依賴性
- ncHMR detector同時(shí)可以基于Ostu's方法反饋HMR的非經(jīng)典功能作用的基因區(qū)域
本文的實(shí)例論證作者使用ncHMR detector在多個(gè)細(xì)胞系內(nèi)找出了12個(gè)HMRs的非經(jīng)典功能以及候選的輔因子,并對其中一個(gè)進(jìn)行了實(shí)驗(yàn)驗(yàn)證
- PRC1復(fù)合體內(nèi)的CBX7可以不依賴于H3K27me3而與NANOG結(jié)合調(diào)控mESC細(xì)胞的多能性
研究思路
-
作者對已經(jīng)報(bào)道的LNCap-abl細(xì)胞內(nèi)EZH2結(jié)合位點(diǎn)的H3K27me3信號進(jìn)行了檢視(density plot),發(fā)現(xiàn)EZH2結(jié)合位點(diǎn)的H3K27me3信號明顯可以看出來為雙峰模式:
雙峰紅色線條為全局H3K27me3信號模式,綠色線條為有H3K27me3信號結(jié)合的區(qū)域,藏藍(lán)色線條為H3K27me3信號弱或無區(qū)域
-
同時(shí)作者發(fā)現(xiàn)已被報(bào)道的輔因子在EZH2 peaks區(qū)域的結(jié)合信號與H3K27me3是互斥的(可以理解為上面的藏藍(lán)色區(qū)域與綠色區(qū)域):
互斥 -
以上兩點(diǎn)構(gòu)成了的設(shè)計(jì)理論基礎(chǔ)
- 最好有雙峰模式支持HMRs的經(jīng)典/非經(jīng)典功能
- 需要有輔因子的高密度結(jié)合
- 輔因子高密度結(jié)合區(qū)域存有低或無信號的組蛋白修飾
-
ncHMR detector的工作原理包括以下四步:
-
第一步,對特定的HMR統(tǒng)計(jì)其底物或者產(chǎn)物peaks前后5kb或者1kb(根據(jù)信號類型有差別)的信號值,同時(shí)統(tǒng)計(jì)這些peaks區(qū)域是否有其他轉(zhuǎn)錄因子的結(jié)合(一般來源于公共數(shù)據(jù)庫,或者實(shí)驗(yàn)室數(shù)據(jù))
第一步 -
第二步,使用penalized linear regression找出與底物或者產(chǎn)物信號值負(fù)相關(guān)的轉(zhuǎn)錄因子數(shù)據(jù),作為初步候選輔因子
?第二步
-
-
第三步,經(jīng)過篩選的轉(zhuǎn)錄因子數(shù)據(jù)再使用單變量線性回歸的方法擬合其與組蛋白修飾信號共發(fā)生的模型,留下回歸系數(shù)小于零(負(fù)相關(guān)),決定系數(shù)大于等于0.1的轉(zhuǎn)錄因子作為可以認(rèn)為是HMRs非經(jīng)典作用的輔因子
?第三步
-
第四步,為了反饋預(yù)測的非經(jīng)典功能的作用基因位點(diǎn),HMR的peaks被封為經(jīng)典和非經(jīng)典兩類進(jìn)行輸出
?第四步
作者針對ncHMR detector尋找輔因子較高的特異性和準(zhǔn)確性進(jìn)行了計(jì)算論證,并同已有的一些算法進(jìn)行了比較(此處略去計(jì)算方面的講解),說明了ncHMR detector的優(yōu)越性
-
作者收集了公共數(shù)據(jù)庫的data使用ncHMR detector進(jìn)行了HMRs非經(jīng)典功能的尋找,展示了排名前列的數(shù)據(jù):
統(tǒng)計(jì)結(jié)果
我們可以發(fā)現(xiàn)其中EZH2就在human cell line中被報(bào)道與E2F1存在非經(jīng)典功能互作,作者的預(yù)測結(jié)果還揭示了EZH2在mouse ESC細(xì)胞中可能同樣存在相同的非經(jīng)典功能互作(通過human和mouse非經(jīng)典結(jié)合位點(diǎn)的聯(lián)合分析,作者還推測EZH2的非經(jīng)典功能是物種保守的,行使相似的功能)。

同時(shí)使用RNF2的mESC數(shù)據(jù)作者也成功的找出了被報(bào)道過的MED12的蹤跡,也發(fā)現(xiàn)RNF2極有可能存在多種輔因子互作的可能(MED12和KDM1A的peak在非經(jīng)典功能區(qū)域高度重合)

-
作者對預(yù)測結(jié)果排名第一的HMR(CBX7)與其非經(jīng)典功能輔因子NANOG進(jìn)行了實(shí)驗(yàn)驗(yàn)證
CBX7是PCR1復(fù)合物的組成部分,可以識別H3K27me3和H3K9me3修飾
在mESC中,CBX7的peaks中NANOG的結(jié)合信號與H3K27me3和H3K9me3修飾信號負(fù)相關(guān)
CBX7的peaks中NANOG的結(jié)合信號遠(yuǎn)離promoter并且與H3K27ac修飾重合(解釋為非經(jīng)典功能為通過enhancer的形式增強(qiáng)基因表達(dá)),而CBX7與H3K27me3和H3K9me3修飾信號重合大多在promoter區(qū)域,說明了CBX7的classical function和non-classical function的區(qū)別
-
CBX7的敲除實(shí)驗(yàn)說明了CBX7和NANOG的結(jié)合,并且論證了CBX7和NANOG的結(jié)合在Nanog基因上游遠(yuǎn)端形成增強(qiáng)子(enhancer)促進(jìn)了mESC的多能行,這就是CBX7的非經(jīng)典功能,且并不依賴與它的經(jīng)典功能
image
image
總結(jié)
作者開發(fā)的工具已經(jīng)開源并且提供了一些已經(jīng)處理好的數(shù)據(jù)(基于細(xì)胞系分類):
- K562 peak files (hg38) Dropbox TongjiServer
- GM12878 peak files (hg38) Dropbox TongjiServer
- HepG2 peak files (hg38) Dropbox TongjiServer
- Hela peak files (hg38) Dropbox TongjiServer
- human ESC peak files (hg38) Dropbox TongjiServer
- mouse ESC peak files (mm10) Dropbox TongjiServer
一句話歸納
該文章給了我們認(rèn)識HMR的新角度,并且可以利用該作者開發(fā)的ncHMR detectors去進(jìn)行我們的data mining






