可變剪切——可變剪接及其表觀遺傳調(diào)控

Original 表觀遺傳學(xué)習(xí)小組 Epigenetics表觀遺傳學(xué)

本文根據(jù) 2016 年 8 月復(fù)旦大學(xué)倪挺教授在「表觀基因組學(xué)暑期國(guó)際講習(xí)班」中的報(bào)告整理而成,本文采用第一人稱敘述,文中的“我”皆指倪挺教授。報(bào)告原視頻詳見(jiàn):表觀遺傳系列視頻13 | 復(fù)旦倪挺:表觀遺傳調(diào)控與基因剪接(附PPT),視頻全長(zhǎng)約 2h34min,文字約 1.6 萬(wàn)字。雖然是四年前的視頻,但內(nèi)容依然不過(guò)時(shí),可幫助我們快速建立對(duì)轉(zhuǎn)錄水平表觀調(diào)控的認(rèn)識(shí)。
倪挺博士,復(fù)旦大學(xué)博士生導(dǎo)師。2000 年獲北京大學(xué)生命科學(xué)學(xué)院生物化學(xué)及分子生物學(xué)系學(xué)士學(xué)位,2000-2006 年碩博連讀于北京大學(xué)生命科學(xué)學(xué)院,并于 2006 年獲植物學(xué)博士學(xué)位。2007-2010 年在美國(guó)杜克大學(xué)基因組科學(xué)與政策研究所從事博士后研究。2010-2012 年在美國(guó)國(guó)立衛(wèi)生研究院 (NIH) 擔(dān)任助理研究員 (Research Fellow)。2012 年受聘為復(fù)旦大學(xué)生命科學(xué)學(xué)院研究員。以下為正文:大家好,今天跟大家分享「表觀遺傳與基因剪接」。我此前的研究主要針對(duì)轉(zhuǎn)錄過(guò)程開(kāi)發(fā)一些方法,探究轉(zhuǎn)錄如何起始、中間調(diào)控機(jī)制以及 3’-端的加尾,此外還包括 3’-UTR和反義 RNA 的調(diào)控等。2012 年來(lái)到復(fù)旦大學(xué)后,我主要選擇了兩個(gè)體系:細(xì)胞衰老和細(xì)胞活化,聚焦 RNA 水平的調(diào)控,特別關(guān)注內(nèi)含子保留這種可變剪接類型,及其在 T 細(xì)胞活化過(guò)程中的功能;此外,還研究選擇性多聚腺苷酸化(alternative polyadenylation),即決定 RNA 在哪個(gè)位置加上 Poly(A) 尾巴的機(jī)制,從而對(duì) mRNA 的命運(yùn)產(chǎn)生影響。研究手段主要采用干濕結(jié)合,試圖觀察新現(xiàn)象并探討其生物學(xué)機(jī)制。

圖1. 倪挺研究員的主要研究?jī)?nèi)容

此前頡偉老師其實(shí)已經(jīng)把 DNA 甲基化和組蛋白修飾之間的關(guān)系講得比較清楚了,DNA 甲基化可以影響組蛋白修飾,反過(guò)來(lái),組蛋白修飾也可以影響 DNA 甲基化。我們今天講的選擇性剪接,能否與 DNA 甲基化和組蛋白修飾聯(lián)系在一起呢?

圖2.可變剪接與表觀遺傳修飾之間的聯(lián)系

通過(guò)這個(gè)課程,希望大家思考圖 2 中的這四個(gè)箭頭是否成立?如果成立,證據(jù)是什么?可能的機(jī)制是什么?這四個(gè)問(wèn)題的內(nèi)容是: (1) 組蛋白修飾是否可以影響 RNA 剪接?(2) RNA 剪接是否可以影響組蛋白修飾?(3) DNA 甲基化是否會(huì)影響 RNA 剪接?(4) RNA 剪接本身對(duì) DNA 甲基化有沒(méi)有影響?針對(duì)這幾個(gè)主要問(wèn)題,我的課分為以下六個(gè)部分: (1) 首先回顧可變剪接的生物學(xué)意義;(2) 有了意義之后,我們想要更好地去檢測(cè)它,從單基因的層面如何檢測(cè)和驗(yàn)證,以及如何檢測(cè)整個(gè)基因組的變化;(3) 如果存在這樣的變化,上游的調(diào)控機(jī)制是什么?是什么東西導(dǎo)致了它的改變?(4) 組蛋白修飾和 (5) DNA 甲基化跟它之間的關(guān)系是怎樣的?(6) 染色質(zhì)修飾與基因轉(zhuǎn)錄終止的關(guān)系。選擇性剪接是中間的環(huán)節(jié),mRNA 的加工最后一個(gè)環(huán)節(jié)是加上 Poly(A) 尾巴,必須完成這個(gè)過(guò)程,mRNA 才能發(fā)揮它的作用。

可變剪接的生物學(xué)意義

現(xiàn)代的遺傳學(xué)主要探究基因型和環(huán)境如何相互作用,從而決定生物的表型。在這個(gè)框架下,中心法則至關(guān)重要,也就是說(shuō),基因型是如何通過(guò)表達(dá)產(chǎn)生蛋白質(zhì),從而對(duì)表型產(chǎn)生影響。在這個(gè)過(guò)程中,環(huán)境可以通過(guò)多種方式發(fā)揮作用,比如可能引起 DNA 的改變;除了引起 DNA 的改變,環(huán)境更多地只影響基因的表達(dá),那么通過(guò)什么方式呢?我們認(rèn)為,DNA 甲基化和組蛋白修飾以及其他的因素在里面起到非常重要的作用,即可以通過(guò)影響中心法則的中間環(huán)節(jié)影響表型。


圖3. 基因和環(huán)境共同作用決定表型

中心法則看起來(lái)非常簡(jiǎn)單,DNA 通過(guò)轉(zhuǎn)錄產(chǎn)生 RNA,RNA 通過(guò)翻譯產(chǎn)生蛋白質(zhì)。但在這個(gè)簡(jiǎn)單的過(guò)程中,存在非常復(fù)雜的調(diào)控。在原核和真核生物中,雖然執(zhí)行的都是中心法則,但調(diào)控不一樣。在原核生物中,轉(zhuǎn)錄和翻譯幾乎是同時(shí)進(jìn)行的,轉(zhuǎn)錄出來(lái)的 RNA 馬上有核糖體結(jié)合上去翻譯出蛋白質(zhì)。但真核生物有細(xì)胞核,轉(zhuǎn)錄出來(lái)的 mRNA 需要加工為成熟的 mRNA,被轉(zhuǎn)移到細(xì)胞質(zhì)中,才能發(fā)揮它的作用;在這個(gè)過(guò)程中,存在位置的調(diào)控;另外,mRNA 還面臨著非常復(fù)雜的加工。因此,原核和真核生物在遺傳信息的流動(dòng)和調(diào)控上是非常不一樣的。


圖4. 遺傳信息流在原核與真核細(xì)胞間的差別

我們仔細(xì)看一下真核生物的基因表達(dá)調(diào)控 (圖5),這是一個(gè)多步驟的調(diào)控,分為細(xì)胞核和細(xì)胞質(zhì)中的調(diào)控。在細(xì)胞核里面,DNA 甲基化和染色質(zhì)結(jié)構(gòu)的改變可調(diào)控基因轉(zhuǎn)錄,還存在轉(zhuǎn)錄的起始和轉(zhuǎn)錄過(guò)程的調(diào)控。最初轉(zhuǎn)錄出來(lái)的是初始轉(zhuǎn)錄本,里面包含內(nèi)含子,在此后的加工過(guò)程中,5’-端需要加上帽子,內(nèi)含子需要切掉,還需要加上 Poly(A) 尾巴,才能變成成熟的 mRNA。在這個(gè)過(guò)程中,還有一系列的蛋白結(jié)合上去,最后輸出到細(xì)胞質(zhì)中。在細(xì)胞質(zhì)中,會(huì)面臨多重命運(yùn),一開(kāi)始會(huì)翻譯,翻譯到一定豐度后,還會(huì)面臨降解的命運(yùn),不同 mRNA 降解的速率也不一樣,這里面也存在一些調(diào)控。在蛋白質(zhì)水平,翻譯出來(lái)的多肽也面臨著蛋白質(zhì)的加工和折疊,以及蛋白質(zhì)激活(比如磷酸化或去磷酸化)和蛋白質(zhì)降解。真核生物的基因表達(dá)調(diào)控是一個(gè)多步驟的非常復(fù)雜的過(guò)程,任何一個(gè)環(huán)節(jié)的失調(diào)都可能導(dǎo)致生理的失衡,最終導(dǎo)致疾病。

圖5. 真核生物基因表達(dá)是個(gè)多步調(diào)控過(guò)程

舉幾個(gè)例子,第一個(gè)例子是早衰 (premature),核纖層蛋白基因 LMNA 的可變剪接的失衡是導(dǎo)致早衰最重要的原因。在早期對(duì)病理進(jìn)行檢查時(shí)發(fā)現(xiàn),在父母中都沒(méi)有出現(xiàn)突變,但是在小孩中出現(xiàn)了突變,即這是一種新發(fā)突變 (de novo mutation),這種突變并不是由父代傳給子代的,但這種突變會(huì)導(dǎo)致很嚴(yán)重的問(wèn)題,從基因的角度來(lái)看,這種突變對(duì)轉(zhuǎn)錄產(chǎn)物造成很嚴(yán)重的影響。在正常情況下,LMNA 有三個(gè)外顯子形成正常的剪接,翻譯出的蛋白含有 C-端結(jié)構(gòu)域;但是由于突變的存在,導(dǎo)致了剪接方式的改變,這種突變使它發(fā)生了 5’-可變剪接位點(diǎn) (alternative site) 的選擇,使得可翻譯的區(qū)域變短了,最后使得蛋白質(zhì)的 C-端完全不一樣,失去定位的信號(hào),蛋白在細(xì)胞核的分布變得紊亂。
圖6. 核纖層結(jié)構(gòu)蛋白基因 *LMNA *突變影響可變剪接,最終導(dǎo)致早衰

核纖層蛋白支撐著細(xì)胞的整個(gè)架構(gòu),如果發(fā)生紊亂的話,原來(lái)的細(xì)胞核構(gòu)架坍塌。這種變化跟細(xì)胞的整體表達(dá)有關(guān),核纖層的架構(gòu)支撐了很多基因的表達(dá),這樣一些關(guān)鍵結(jié)構(gòu)蛋白的失衡,導(dǎo)致了核纖層的坍塌,進(jìn)而影響很多下游基因表達(dá)的改變,最終導(dǎo)致了早衰的表型。早衰兒在很早的時(shí)候就去世了。在這個(gè)例子中,我們可以看到,一個(gè)非常關(guān)鍵基因的可變剪接的變化就導(dǎo)致了早衰的產(chǎn)生,這提示可變剪接在生物體中十分重要。另一個(gè)例子,不是 DNA 層面的突變,而是表達(dá)層面的。RBM4 是一個(gè) RNA 結(jié)合蛋白,同時(shí)參與剪接過(guò)程,這個(gè)蛋白在很多癌癥病人中是下降的,導(dǎo)致了很多基因剪接方式的改變。如果 RBM4 表達(dá)較高,它會(huì)讓基因選擇一種比較短的形式進(jìn)行剪接;如果它的表達(dá)量低的話,會(huì)讓基因選擇一種比較長(zhǎng)的形式,而這種長(zhǎng)的形式會(huì)抑制細(xì)胞的死亡,即讓細(xì)胞無(wú)限增殖,導(dǎo)致了癌癥的發(fā)生和發(fā)展。在這個(gè)過(guò)程中,只有 RBM4 保持合適的數(shù)量,基因的剪接才會(huì)正常,細(xì)胞呈現(xiàn)正常的狀態(tài);基因的表達(dá)如果改變的話,會(huì)引起下游一系列的變化。
圖7. *RBM4*基因表達(dá)量下降促進(jìn)腫瘤發(fā)展和轉(zhuǎn)移[1]

特別要強(qiáng)調(diào)的是,剪接依賴于順式作用元件(DNA 上的序列)和反式作用因子(與這些序列結(jié)合的蛋白)。而這兩個(gè)例子,一個(gè)是可變剪接的順式作用元件的突變,另一個(gè)是反式作用因子剪接因子的改變,這兩者都可能導(dǎo)致剪接方式的改變,最終引起疾病??勺兗艚邮堑鞍踪|(zhì)組豐富度的重要貢獻(xiàn)者,但近來(lái)的研究發(fā)現(xiàn),很多基因也存在著很多 Poly(A) 位點(diǎn)的選擇 (alternative cleavage and polyadenylation, APA),這種選擇也很大程度上貢獻(xiàn)了蛋白質(zhì)組的選擇性。在這個(gè)例子中,并沒(méi)有改變編碼區(qū)的序列,翻譯出來(lái)的蛋白質(zhì)是一樣的,但是由于選擇了近端的 Poly(A)位點(diǎn),使得多出來(lái)的 3’-UTR 不僅被 miRNA 調(diào)控,同時(shí)也會(huì)被特殊的 RNA 結(jié)合蛋白調(diào)控。miRNA 在 3’-UTR 的結(jié)合會(huì)切割 mRNA,或者抑制 mRNA 的翻譯,最終使得蛋白水平下降,有些 RNA 結(jié)合蛋白也會(huì)起到類似的效果。有的是抑制,有的是促進(jìn),效果迥異,取決于序列和蛋白本身。通過(guò)這種方式,逃脫 miRNA 的調(diào)控。


圖8. mRNA 3'-端 Poly(A) 加尾異??蓪?dǎo)致癌變 [2]

2009 年的一項(xiàng)研究發(fā)現(xiàn),相對(duì)于癌旁細(xì)胞,癌細(xì)胞中有很多傾向于使用短的 3’-UTR 的轉(zhuǎn)錄本,即轉(zhuǎn)錄本是以短的形式存在的,比如 IGF2BP1/IMP-1 因?yàn)槭褂枚痰?Poly(A) 而逃脫了 miRNA 的調(diào)控[3],使得蛋白質(zhì)水平急劇上升,導(dǎo)致細(xì)胞的無(wú)限增殖,是引起細(xì)胞癌變的重要因素。這個(gè)例子說(shuō)明,RNA 加工過(guò)程(特別是可變剪接和末端的加工)的失衡也是引起疾病的重要因素。

可變剪接的檢測(cè)及生信分析策略

研究可變剪接和 3’-端的加工具有重要的意義,可以幫我們理解很多重要的生物學(xué)事件。既然它們?nèi)绱酥匾敲慈绾胃玫匕l(fā)現(xiàn)和分析呢?這就涉及到可變剪接的檢測(cè)及生信分析策略。

可變剪接的類型

大部分基因含有內(nèi)含子,在編碼的過(guò)程中,內(nèi)含子的信息不需要傳遞給蛋白質(zhì)。在轉(zhuǎn)錄完成后形成的初始 mRNA 后,所有的內(nèi)含子都切掉,這是一種正常的剪接方式,即組成型剪接 (constitutive splicing)??勺兗艚?(alternative splicing) 跟它有一定區(qū)別,例如在正常情況下,三個(gè)外顯子在一起;如果發(fā)生了可變剪接,由于某些原因中間的外顯子被跳過(guò),形成的 mRNA 不一樣,這種序列的不一樣可能使蛋白質(zhì)中間少了一段,或者中間的外顯子不是 3 的倍數(shù)的話,那么它會(huì)使得后面的蛋白質(zhì)完全不一樣了,改變了蛋白質(zhì)的組成。


圖9. 可變剪接的 5 種形式(圖片來(lái)自:https://bio.libretexts.org)

可變剪接分為哪幾種類型呢?復(fù)雜的話可分為 8 種,簡(jiǎn)單的看至少有 5 種比較重要。第一種叫外顯子跳躍 (exon skipping),中間的外顯子可以被跳掉,取決于中間外顯子兩邊的順式作用元件是什么以及有哪些反式作用因子跟它結(jié)合。另一種類型,5’-端的選擇,比如我們剛才舉的例子,RBM4 去調(diào)控基因剪接,實(shí)際上就是通過(guò)這種方式。5’-端是看具體選擇哪個(gè)位置,取決于位點(diǎn)的強(qiáng)弱。3’-端面臨同樣的情況,到底選擇哪個(gè)3’-端,這也就是 alternative 3’ splice site;另一種比較有意思的是互斥外顯子 (mutually exclusive exons),中間有兩個(gè)外顯子,但是細(xì)胞只會(huì)選擇中間的一個(gè)來(lái)發(fā)揮作用,在蛋白質(zhì)上的體現(xiàn)是,蛋白質(zhì)的 domain 是換成這個(gè)還是那個(gè),從而決定了蛋白質(zhì)的功能。另一個(gè)是內(nèi)含子保留,在很多時(shí)候,那段序列被認(rèn)為是內(nèi)含子,被剪切掉了,但是在特殊的情況下,細(xì)胞認(rèn)為這可能是外顯子的信號(hào),在這個(gè)過(guò)程中會(huì)被保留下來(lái),即內(nèi)含子保留。這幾種方式,從造成的效應(yīng)上來(lái)看,它們改變蛋白的“質(zhì)”和“量”?!百|(zhì)”的話,在早衰癥的例子中,蛋白質(zhì)的 C-端完全不一樣,更多的是改變了蛋白質(zhì)的“質(zhì)”;如何理解改變蛋白質(zhì)的“量”呢,在這幾個(gè)例子中,好像都沒(méi)有體現(xiàn)。實(shí)際上,一個(gè)基因可變剪接,并不是切掉或者完全保留,而是有一部分是剪切掉,有一部分是留著的,如果說(shuō)被剪切掉的 isoform(異構(gòu)體)沒(méi)有功能的話,與最后翻譯出來(lái)的另一種剪接形式的異構(gòu)體形成了競(jìng)爭(zhēng)關(guān)系,原來(lái) 100% 都剪接掉了,現(xiàn)在分流給了另一個(gè)不翻譯的轉(zhuǎn)錄本,原來(lái)那個(gè)翻譯的蛋白的量就相對(duì)減少,這就是改變了特定蛋白的量。所以,可變剪接至少可以通過(guò)改變蛋白的“質(zhì)”和“量”對(duì)下游產(chǎn)生影響。

可變剪接的鑒定及生信分析策略

如何發(fā)現(xiàn)可變剪接?可通過(guò) RNA-seq 和 RT-PCR。最早的時(shí)候,大家實(shí)際上是在單基因上進(jìn)行驗(yàn)證,可通過(guò) RT-PCR 或 Northern Blot 來(lái)看;如果要從整個(gè)基因組水平來(lái)看的話,早期可通過(guò) microarray,設(shè)計(jì)剪切特異性的探針就能夠達(dá)到這個(gè)目的。但近年來(lái),通過(guò) RNA-seq 結(jié)合一些生信的辦法就可以實(shí)現(xiàn)。


圖10. 單基因水平檢測(cè)可變剪接

從原理性上講,如果有幾個(gè)不同的外顯子,可在不同的外顯子上設(shè)計(jì)引物,或者說(shuō)跨外顯子的引物。如果發(fā)生了外顯子跳躍,設(shè)計(jì)類似圖 10 中的引物,兩個(gè)不同的 isoform 擴(kuò)增出來(lái)的產(chǎn)物是不一樣的,直接跑膠就可以看到差別。實(shí)際上并不是一個(gè)有或無(wú),可能是強(qiáng)和弱的關(guān)系,這個(gè)只是個(gè)示意圖。對(duì)于 Northern Blot,同樣也是設(shè)計(jì) jumping 特異性的探針,跳過(guò)外顯子區(qū)來(lái)設(shè)計(jì),這是比較常規(guī)的思路。


圖11. 轉(zhuǎn)錄組水平檢測(cè)可變剪接

對(duì)于整個(gè)基因組,也可以設(shè)計(jì)一些 jumping 特異的探針,如果你看到有信號(hào)的話,說(shuō)明這個(gè) isoform 存在,信號(hào)強(qiáng)弱可以初步反映這個(gè)異構(gòu)體豐度的高低。對(duì)于 RNA-seq,它實(shí)際上測(cè)到的是一個(gè)短序列,通過(guò)這個(gè)短序列去比對(duì)到基因組和轉(zhuǎn)錄組上,其實(shí)可以區(qū)分。通過(guò)這樣一種方式,就可以知道幾個(gè)不同的 isoform 之間的比例變化。
圖11. RNA-seq的實(shí)驗(yàn)及生物信息學(xué)分析全過(guò)程 [4]

目前 RNA-seq 是發(fā)現(xiàn)全基因組剪接變化最有效的方法,當(dāng)然這里面還存在著諸多問(wèn)題和挑戰(zhàn)。RNA-seq 通常要做兩輪 Poly(A) 選擇,把這些短序列去 mapping,通過(guò)分析計(jì)算有沒(méi)有出現(xiàn)外顯子的跳躍或者其他形式,還可以比較兩個(gè)不同組織或者處理前后的改變,幫助你推斷它可能參與的生物學(xué)過(guò)程。我想強(qiáng)調(diào)的一點(diǎn)是,數(shù)據(jù)產(chǎn)生的好壞對(duì)你后面的分析是非常重要的。如果實(shí)驗(yàn)有問(wèn)題,后面的分析 pipeline 再靠譜也無(wú)濟(jì)于事。比如說(shuō)處理正常和疾病的兩組樣本,今天做正常的,明天做疾病的,這個(gè)時(shí)候再進(jìn)行比較就可能出問(wèn)題,因?yàn)榇嬖谂涡?yīng)??勺兗艚臃治錾婕暗倪^(guò)程很多,包括怎樣把這些位置 mapping 回去,怎樣組裝轉(zhuǎn)錄本以及推測(cè)其表達(dá)量,這個(gè)表達(dá)量當(dāng)然是整體的表達(dá)量,還要根據(jù) junction 的位置去預(yù)測(cè)不同 isoform 的表達(dá)量,雖然不一定那么準(zhǔn),但可在基因表達(dá)比較高時(shí)給你一個(gè)還不錯(cuò)的參考,然后還可以進(jìn)行一些可視化。接下來(lái)還有一些對(duì)于剪接特異性的分析,有各種不同的軟件,都有它自己的優(yōu)缺點(diǎn),一定要非常仔細(xì)的去看它的 manual 以及相關(guān)文章,還要和作者進(jìn)行密切的交流。利用 RNA-seq 進(jìn)行初步的基因表達(dá)差異和轉(zhuǎn)錄本分析,TopHat 目前用的比較多。原理上是怎么區(qū)分不同的轉(zhuǎn)錄本的呢?舉個(gè)例子,一個(gè)基因有三個(gè)轉(zhuǎn)錄本,A、B 兩個(gè)轉(zhuǎn)錄本的轉(zhuǎn)錄起始位點(diǎn)是一樣的,但另一個(gè)轉(zhuǎn)錄本 C,用了不同的轉(zhuǎn)錄起始位點(diǎn)(在內(nèi)含子區(qū)域),對(duì)于使用相同的兩個(gè)轉(zhuǎn)錄起始位點(diǎn)的話,它唯一的差別實(shí)際上是內(nèi)含子跳躍與否。對(duì)于這樣的三個(gè)基因,如果基因表達(dá)比較高,測(cè)的短序列 reads 比較高,你可以初步地對(duì)每個(gè)占多少比例進(jìn)行分析,用的策略是看它特有的 reads。


圖12. 可區(qū)分高表達(dá)基因的具有明顯特征的不同轉(zhuǎn)錄本 [5]

比如對(duì)于 A、B,如果看到第一個(gè)外顯子,你至少可以知道 A、B 兩個(gè)轉(zhuǎn)錄本的總量,那么在這兩個(gè)轉(zhuǎn)錄本中怎樣區(qū)分比例多少,就看中間外顯子信號(hào)的多少,實(shí)際上就是用 isoform 特有的區(qū)域來(lái)區(qū)分;對(duì)于轉(zhuǎn)錄本 C,你可以看到 C 中左邊的信號(hào)。通過(guò)這樣的比較,你就可以區(qū)分不同的特征的比例多少,前提是基因的表達(dá)量比較高,基因測(cè)序的 reads 分布比較均勻,可以給你大致的線索,然后你再設(shè)計(jì)一些 isoform 特異性的引物來(lái)驗(yàn)證。有了這些之后,你可以進(jìn)行初步的推斷。你可以運(yùn)用一些工具畫(huà)出三個(gè)或者四個(gè)不同轉(zhuǎn)錄本在不同細(xì)胞或者不同時(shí)期的變化。如果看到了差別,僅說(shuō)明轉(zhuǎn)錄本存在與否,但對(duì)于生物學(xué)過(guò)程來(lái)說(shuō),這個(gè)存在與否的調(diào)控看不出來(lái),它沒(méi)有動(dòng)態(tài)的改變,而如果特定的轉(zhuǎn)錄本存在動(dòng)態(tài)改變的話,實(shí)際上是對(duì)它功能的暗示,在這個(gè)過(guò)程中,它有可能是參與了這個(gè)過(guò)程,當(dāng)然也有可能是一個(gè)伴隨的現(xiàn)象,但至少可以給你一些線索。


圖 13. CummeRbund 工具可畫(huà)出不同轉(zhuǎn)錄本的表達(dá)動(dòng)態(tài)圖 [5]

在可視化的展示(圖14)中,對(duì) regucalcin基因來(lái)講,兩個(gè)不同狀態(tài)之間基因總體的表達(dá)量差了約兩倍,但如果這個(gè)基因有四種不同的 isoform,那么是每個(gè) isoform 都增加了兩倍,還是說(shuō)其中只有幾個(gè) isoform 發(fā)生了改變?因?yàn)檠芯抗δ軙r(shí)要聚焦于不同的 isoform,不同 isoform 翻譯的蛋白可能不一樣,這個(gè)時(shí)候能夠把不同 isoform 區(qū)分開(kāi)的話,你可能就會(huì)發(fā)現(xiàn),實(shí)際上其中一個(gè) isoform 占的比例比較大,可能是它增加了兩倍,所以后面的功能驗(yàn)證或分析就可以集中在這個(gè) isoform 上。通過(guò)這樣的可視化,你也知道原來(lái)這個(gè) isoform 是真的存在的,通過(guò)這樣一個(gè)側(cè)面的證據(jù)可以幫助你更好地去鎖定研究對(duì)象。

圖14. 特定基因* regucalcin *的可視化展示

這個(gè)實(shí)際上是一個(gè)很整體很籠統(tǒng)的分析,具體做的時(shí)候?qū)嶋H上存在很多的挑戰(zhàn)。相對(duì)于基因總體的表達(dá)量來(lái)說(shuō),分析它的可變剪接的難度是相對(duì)較高的。以前測(cè)的序列比較短,現(xiàn)在雖然測(cè)的比較長(zhǎng),但總體上來(lái)講仍然不是那么長(zhǎng),比如說(shuō)能夠覆蓋兩個(gè) exon,但覆蓋不了整個(gè)轉(zhuǎn)錄本,你可能只能發(fā)現(xiàn)這個(gè)內(nèi)含子和這個(gè)外顯子包括與否,但如果說(shuō)這邊有一個(gè)外顯子跳躍,后面還有一個(gè)外顯子跳躍,你無(wú)法判斷這兩個(gè)外顯子的跳躍是不是在一個(gè)轉(zhuǎn)錄本上,短的序列仍然不能回答。所以以后在讀長(zhǎng)上要有突破,包括加強(qiáng)測(cè)序質(zhì)量,測(cè)序的時(shí)候末端序列不是那么準(zhǔn)的,但我們?nèi)タ?junction reads,通常把它一劈為二,這邊多一點(diǎn),這邊少一點(diǎn),mapping 回去;有的地方測(cè)序質(zhì)量比較差的話,mapping 回去也會(huì)差,mapping 出來(lái)的基因可能也是錯(cuò)的,這是我們需要注意的。另一個(gè)我們需要注意的問(wèn)題是讀長(zhǎng)分布的不均勻。測(cè)到的 reads 分布在轉(zhuǎn)錄本的不同區(qū)域,但你去看各種不同的 track 圖時(shí),有的地方特別高,有的地方特別低,原因多種多樣。比如有的地方 GC 含量特別高,就不容易測(cè)出來(lái),特別的低也不容易測(cè)出來(lái),或者有重復(fù)序列。這樣的 reads mapping 回去的時(shí)候,它不知道是這個(gè)基因的,所有我們就把它過(guò)濾掉了,因?yàn)闆](méi)辦法告訴你是哪個(gè)地方來(lái)源的。這個(gè)時(shí)候 junction reads 比較高的地方,你就能夠判斷得比較準(zhǔn),但有的 junction 根本沒(méi)有 reads 在這個(gè)地方 cover,這時(shí)候也會(huì)對(duì)可變剪切的分析造成影響。這種基因內(nèi)部分布的不均勻可能是導(dǎo)致 RNA-seq 分析逐漸下降的一個(gè)很重要的原因。另外,有些剪切本本身表達(dá)量就比較低,意味著 reads 中能夠貢獻(xiàn)到這個(gè)地方的量就特別的小。對(duì)可變剪切分析而言,你可能只能分析表達(dá)量相對(duì)比較高的地方,至少可以給你得出一些線索。另外,不同的分析軟件得到的結(jié)果是不一樣的,原因多種多樣,可能只能根據(jù)技術(shù)不停的發(fā)展和認(rèn)識(shí)的深入去克服這個(gè)問(wèn)題。但我認(rèn)為很重要的一個(gè)標(biāo)準(zhǔn)是怎樣更好地和實(shí)驗(yàn)結(jié)合起來(lái),如果分析的好的話,可能 60-70% 可以驗(yàn)證;分析不好的話,假陽(yáng)性特別高,只有 20-30% 能夠驗(yàn)證。在開(kāi)始做的時(shí)候,我的建議是你寧愿讓標(biāo)準(zhǔn)設(shè)的嚴(yán)一點(diǎn),發(fā)現(xiàn)的少一點(diǎn),但讓假陽(yáng)性低一點(diǎn),可驗(yàn)證程度高一點(diǎn),可能是一個(gè)更好的策略。剛才講了不均一性,簡(jiǎn)單來(lái)講可減少 PCR 的循環(huán)數(shù),因?yàn)?PCR 循環(huán)數(shù)減少的話,這種情況稍微得到改善,但最好的是你不做任何的擴(kuò)增,但除非起始的 RNA 的量特別多,一般 RNA 比較少,尤其像做少量細(xì)胞甚至單細(xì)胞 RNA-seq 的時(shí)候,你必須進(jìn)行一些擴(kuò)增,擴(kuò)增帶來(lái)的問(wèn)題就是不均一性會(huì)更強(qiáng),但實(shí)際上這是對(duì)你要研究這個(gè)問(wèn)題的妥協(xié),你為了研究它,你只能在目前技術(shù)不允許的前提下,你只能用一個(gè)相對(duì)將就的辦法,但至少可以給你拿到一些新的發(fā)現(xiàn)。另外,去開(kāi)發(fā)更高效可靠的分析軟件。當(dāng)然說(shuō)起來(lái)容易,做起來(lái)不一定。另外增加讀長(zhǎng),如果說(shuō)我們能夠做到一個(gè)全轉(zhuǎn)錄本測(cè)序的話,實(shí)際上是一個(gè)比較好的策略。因?yàn)閯傞_(kāi)始講的,如果不同的剪接事件在同一個(gè) isoform 上發(fā)生的話,存在一些短序列,實(shí)際上是沒(méi)有辦法解決的,這個(gè)可以用三代測(cè)序,但這里面也存在著一些問(wèn)題,因?yàn)樗m然能夠測(cè)全長(zhǎng),但是錯(cuò)誤率比較高,價(jià)格也非常貴,而且同樣的價(jià)格覆蓋的轉(zhuǎn)錄本是比較少的,所以這個(gè)也有賴于技術(shù)的進(jìn)步。

基因可變剪接的調(diào)控——順式作用元件和反式作用因子

接下來(lái)我們講一下可變剪接的調(diào)控,可變剪接的調(diào)控是非常復(fù)雜的,概括一下我個(gè)人認(rèn)為可以分為三點(diǎn),一個(gè)是順式作用元件,就是 DNA 的序列是什么;第二個(gè)是反式作用因子,哪些 RNA 結(jié)合蛋白在這個(gè)區(qū)域與它結(jié)合;這兩者之間的組合很大程度上決定了可變剪接是如何發(fā)生的;第三是一些表觀遺傳因子可以通過(guò)影響順式作用元件和反式作用因子對(duì)它整個(gè)進(jìn)行調(diào)控。我們對(duì)整個(gè)調(diào)控層面進(jìn)行理解也可分為三個(gè)層面,第一個(gè)是 RNA 層面,反式作用因子和順式作用元件怎樣互作,互作的網(wǎng)絡(luò)可能是比較復(fù)雜的。第二個(gè)是轉(zhuǎn)錄機(jī)器層面的調(diào)控,就是 RNA 聚合酶的快慢或者所反映出來(lái)的延伸速度實(shí)際上在很多時(shí)候決定了剪接位點(diǎn)。第三個(gè)是表觀遺傳層面,不管是染色質(zhì)結(jié)構(gòu)、DNA 甲基化、組蛋白修飾,甚至 RNA 本身的修飾都會(huì)發(fā)揮作用。先來(lái)講順式作用元件和反式作用因子。順式作用元件里面很重要的一個(gè)因素就是剪接位點(diǎn)本身的強(qiáng)弱決定了在這個(gè)位置是否會(huì)跳掉,如果說(shuō)它更愿意與后面外顯子結(jié)合的話,中間的外顯子就容易被跳掉,所以涉及到位置的競(jìng)爭(zhēng)。另外,除了序列本身,我們知道不同的 U1 和 U2 以及其他的一些 snRNP 實(shí)際上跟特定的序列結(jié)合,而這種結(jié)合的 pairing 非常重要。


圖15. 順式作用元件:剪接位點(diǎn)本身的強(qiáng)弱 [6]

這里有個(gè)概念叫 exon definition,它是怎樣定義呢?如圖 15 所示,如果 5’SS 結(jié)合了 U1,3’SS 結(jié)合了 U2,這個(gè)時(shí)候就告訴剪接機(jī)器這個(gè)位置是外顯子,如果有這樣的信息外顯子是被保留的。但如果是另外一種情況,前一個(gè)外顯子的 5’SS 與中間外顯子的 3’SS 形成一個(gè) cap,中間外顯子的 5’SS 與下一個(gè)外顯子的 3’SS 形成一個(gè) cap,這個(gè)剪切機(jī)器會(huì)更多地識(shí)別這兩個(gè) cap,造成外顯子的跳躍,所以在這個(gè)時(shí)候,順式作用元件和反式作用因子是一個(gè)相互的作用。


圖16. 反式作用因子如何與順式作用元件互作 [6]

總的來(lái)看,可變剪接的調(diào)控有兩個(gè)特征:1.序列依賴性,2.位置依賴性。我們?cè)撊绾卫斫饽??很多調(diào)控序列在外顯子內(nèi)或內(nèi)含子里面,先看一下在外顯子內(nèi)部的這些序列,包括 ESE 和 ESS,第一個(gè) E 代表 exon,第二個(gè)代表 splicing,第三個(gè)是 enhancer 或者 silencer,即促進(jìn)或抑制剪接。對(duì)不同的序列本身,有不同的 RNA 結(jié)合蛋白結(jié)合。通常來(lái)講,兩類 RNA 結(jié)合蛋白或剪接因子是比較重要的,一個(gè)是 SR 蛋白,即絲氨酸和精氨酸富集的蛋白;另外一種是 hnRNP,它們識(shí)別的位點(diǎn)不一樣,如果 SR 結(jié)合在剪接的 enhancer 上,那么告訴這個(gè)位點(diǎn)是需要選擇的,最終會(huì)造成圖 16 中上圖的跳躍;如果 hnRNP 結(jié)合在 ESS 上,那么告知這個(gè)位點(diǎn)不要剪接,這樣造成了外顯子跳躍。所以在 exon 上的序列,其實(shí)跟反式作用因子相互作用就能夠決定外顯子的保留與否;當(dāng)然,問(wèn)題沒(méi)有這么那么簡(jiǎn)單,即便對(duì)同一個(gè)轉(zhuǎn)錄因子的話,這個(gè)時(shí)候涉及到位置效應(yīng),它結(jié)合到不同地方,也能夠調(diào)控剪接方向,比如說(shuō)它結(jié)合在上游的 intron 或 exon 里面的話,起到抑制作用;如果結(jié)合在下游的 intron 上面,對(duì)它產(chǎn)生促進(jìn)作用,所以這樣導(dǎo)致了即便有序列和剪接因子的話,不同位置的結(jié)合,效應(yīng)是不一樣的。我們可以簡(jiǎn)單理解,第一種情況是序列依賴性,第二種情況是位置依賴性,讓調(diào)控變得異常復(fù)雜。


圖17. 順式作用元件對(duì)剪接位點(diǎn)的選擇既可以正向也可以反向 [6]

剛才我們講到了 exon 里面的結(jié)合的效應(yīng),intron 里面的結(jié)合也會(huì)有同樣的效應(yīng),有的是促進(jìn),有的是抑制,即在內(nèi)含子和外顯子里面都有正向和負(fù)向的元件。既然存在這些元件,怎樣才能更好地發(fā)現(xiàn)和鑒定這些 DNA 序列到底起到什么作用,這個(gè)時(shí)候涉及到用 mini 基因進(jìn)行篩選。


圖18. 如何設(shè)計(jì)實(shí)驗(yàn)篩選對(duì)剪接有促進(jìn)或抑制作用的順式作用元件 [6]

比如我們想要篩選 ESE,一個(gè)簡(jiǎn)單的辦法是,把這個(gè)地方做成簡(jiǎn)單的隨機(jī)序列庫(kù),如果說(shuō)這個(gè)序列對(duì)于外顯子保留是有作用的話,就能夠看到相應(yīng)的 isoform,通過(guò)隨機(jī)序列不停的選擇,最后細(xì)胞里面出現(xiàn)更多的保留形式 isoform 的話,那么中間的序列更多的是 ESE。對(duì)于外顯子里面的 silencer,用圖 18 右上圖的那個(gè)質(zhì)粒來(lái)鑒定,如果外顯子跳躍,兩端正好拼成一個(gè) GFP 序列,找到含有熒光的細(xì)胞,然后在細(xì)胞里面去看序列是什么,就能夠找到讓外顯子跳躍的序列。如果要找到 intron 去除的序列,可以在圖 18 左下圖中藍(lán)色區(qū)域設(shè)計(jì)一個(gè)隨機(jī)的序列,如果出現(xiàn) GFP,說(shuō)明 intron 被很好地切割掉了,那么這個(gè)序列就是促進(jìn)內(nèi)含子切割的序列。另一個(gè)是 exon skipping,怎樣找到下游 intron 上的一些序列,能夠促進(jìn) exon 的 skipping,可以在圖 18 右下圖中藍(lán)色區(qū)域設(shè)計(jì),如果出現(xiàn) GFP,證明確實(shí)出現(xiàn)了 exon skip。


圖19. 通過(guò)控制核心剪接機(jī)器的組裝來(lái)調(diào)控可變剪接 [6]

除了順式作用元件和反式作用因子,其實(shí)剪接調(diào)控和剪接體本身也有密切聯(lián)系。如果 U1 和 U2 作為 tag 的話,那么中間的序列就定義為 exon。如果說(shuō)有一些因子能夠在那里進(jìn)行競(jìng)爭(zhēng),那么 U1 不跟它直接結(jié)合,這個(gè)時(shí)候 exon definition 其實(shí)就發(fā)生了一些改變,中間的外顯子可能被跳躍掉,這種競(jìng)爭(zhēng)關(guān)系也是可以存在的。實(shí)際上,不光是外顯子的序列,exon enhancer 和蛋白本身就能夠?qū)艚舆M(jìn)行促進(jìn),幾個(gè)因素結(jié)合在一起發(fā)揮作用。圖 19 中的 c 圖,U1 和 U2 形成 pair 以后,如果有一個(gè) ISS,實(shí)際上會(huì)造成 intron retention,這樣的順式作用元件或招募反式作用因子 PTB,就能夠影響 intron definition,讓它成為一個(gè) exon,剪接機(jī)器就不再把這個(gè) intron 給切割掉了,這是 intron retention 的一種機(jī)制。還可以對(duì) U1 本身的占位進(jìn)行調(diào)控,如果沒(méi)有 U1 的話,intron definition 也就沒(méi)有了。通過(guò)這樣一種比較復(fù)雜的方式,決定了 intron 被切割與否,或外顯子被跳躍與否。這些所有講的都是在 RNA 層面進(jìn)行的調(diào)控,第二個(gè)層面是發(fā)生在轉(zhuǎn)錄機(jī)器上,具體來(lái)講,是 RNA 聚合酶 II 在這個(gè)地方跑的快還是慢,研究者在果蠅中發(fā)現(xiàn)了一個(gè) RNA Pol II 變慢的突變體,發(fā)現(xiàn)在 RNA Pol II 快慢兩種情況下,一些基因的可變剪接是不一樣的。


圖20. RNA 聚合酶 II (Pol II) 的延伸速度可決定特定外顯子的跳躍與否[7]

當(dāng) RNA 聚合酶 II 跑的很快時(shí),中間是一個(gè)很弱的 3’SS,根本沒(méi)有來(lái)得及去剪切,這個(gè)時(shí)候強(qiáng)的 3’SS 占了主導(dǎo),原來(lái)比較弱的位點(diǎn)處發(fā)生了 exon skipping,這個(gè)過(guò)程中并沒(méi)有其他反式作用因子來(lái)參與。如果轉(zhuǎn)錄的時(shí)候相對(duì)比較慢,這個(gè)時(shí)候剪切機(jī)器有足夠的時(shí)間來(lái)識(shí)別比較弱的剪切位點(diǎn),這樣就可以發(fā)生正常的剪切,此時(shí) exon 包含。在這個(gè)例子中,弱的剪切信號(hào)可以通過(guò) RNA 聚合酶 II 跑的快慢決定包含與否,這是一個(gè)最簡(jiǎn)單直觀的例子。這個(gè)方式聽(tīng)起來(lái)很簡(jiǎn)單,也很合理,較慢的 Pol II 延伸速度一定導(dǎo)致外顯子的包含嗎?生物學(xué)里面總能找到例外。這個(gè)時(shí)候,可以把反式作用因子也引進(jìn)來(lái)。Pol II 跑的比較慢的時(shí)候,雖然可能發(fā)生了正常的剪接,但是 Pol II 上同時(shí)還結(jié)合了抑制性的反式作用因子的話,可以發(fā)生外顯子跳躍。你會(huì)發(fā)現(xiàn),后面的很多染色質(zhì)跟它的調(diào)控,無(wú)非都是通過(guò)這種套路來(lái)解釋,有了方向以后,再去找,到底是哪個(gè)反式作用因子,是不是真的能解釋這個(gè)現(xiàn)象?從原理上,不難提出假說(shuō)。


圖21. 通過(guò)特定信號(hào)通路來(lái)調(diào)控細(xì)胞核內(nèi)的可變剪接 [6]

我們整個(gè)組織細(xì)胞是一個(gè)動(dòng)態(tài)的過(guò)程,剪接如何發(fā)生以及被調(diào)控,可以通過(guò)細(xì)胞外的信號(hào)傳遞進(jìn)來(lái),這些通路發(fā)生改變后,通過(guò)級(jí)聯(lián)反應(yīng),可改變特定蛋白的磷酸化和其他修飾,而剪接因子也可以發(fā)生很多修飾,這些修飾發(fā)生改變,也可以調(diào)控細(xì)胞核中的剪接事件發(fā)生的多少,通過(guò)這種方式,就可以將剛才講的剪接方式與外界的因素聯(lián)系在一起,在生理或病理情況下,可能就是通過(guò)這種形式來(lái)體現(xiàn)的。

組蛋白修飾與基因可變剪接

既然我們已經(jīng)知道了比較基礎(chǔ)的調(diào)控方式,怎么樣解釋組蛋白和基因可變剪接的關(guān)系?在轉(zhuǎn)錄過(guò)程中,之前我們的模式圖顯示,RNA 離開(kāi)染色體后單獨(dú)加工;如果我們?nèi)タ磳?shí)際情況,轉(zhuǎn)錄出來(lái)的 RNA 和各種組蛋白修飾、RNA 聚合酶 II 還是連成了一個(gè)整體,在它還沒(méi)有從 DNA/染色質(zhì)中下來(lái)的時(shí)候,物理空間是相鄰的,而這樣一種相鄰為兩者之間的相互關(guān)系提供了一種可能性——RNA 上可以結(jié)合一些組蛋白修飾的酶,組蛋白修飾的酶可以對(duì)特定的位點(diǎn)加上修飾;反過(guò)來(lái),這些修飾可以通過(guò)其他方式結(jié)合一些剪接因子,有可能作用在 RNA 上,這樣就存在剪接調(diào)控。當(dāng)然,具體是哪些分子參與,哪些組蛋白修飾發(fā)揮作用,還需要具體鑒定。


圖22. 轉(zhuǎn)錄過(guò)程中 pre-mRNA 與組蛋白修飾間有物理上的相鄰 [8]

我們從不同組蛋白修飾在基因區(qū)域上的分布來(lái)看,很多 marker 在啟動(dòng)子區(qū)域,標(biāo)記基因是否活躍;在活躍基因的內(nèi)部,還有各種不同的修飾,中間的一些組蛋白修飾與可變剪接關(guān)系可能比較緊密。從位置上,我們可以猜測(cè),如果發(fā)生修飾的話,中間的修飾對(duì)剪接的影響可能更大。舉個(gè)例子,染色體中含有一個(gè)比較弱的剪接位點(diǎn),中間有不同的核小體分布,以及組蛋白修飾,這些可以影響 RNA 聚合酶 II 的延伸速度。在比較弱的剪接位點(diǎn),延伸速度比較快的話,就發(fā)生了跳躍;延伸速度比較慢的話,外顯子就能保留。所以,下半部分的機(jī)制,完全是借用了 RNA 聚合酶 II 的延伸速度的快慢,唯一需要證明的是,特定組蛋白修飾和核小體分布是否會(huì)影響 RNA 聚合酶的快慢。很多機(jī)制上的研究,只要把重要的一環(huán)證明,這樣一種機(jī)制就可能成立。


圖23. 核小體密度決定 RNA Pol II 延伸速度,Pol II 速度決定外顯子跳躍 [9]

另外一種調(diào)控方式,特定組蛋白修飾(比如 H3K36me3)的 reader,進(jìn)一步可以結(jié)合剪接因子,可以促進(jìn)也可以是抑制。如果修飾不存在,或者換成其他修飾了,即便你有splicing factor,這種組蛋白修飾仍然不能對(duì)可變剪接進(jìn)行調(diào)控,這樣就造成了外顯子保留。要么在特定位點(diǎn)招募了一些特定蛋白,這個(gè)蛋白只要跟剪接調(diào)控因子結(jié)合在一起,就能夠有效地調(diào)控剪接。當(dāng)然,有個(gè)前提是,里面有個(gè)位點(diǎn)是比較弱的,因?yàn)槿绻容^強(qiáng)的話,可能根本就不需要調(diào)控,或者也沒(méi)辦法調(diào)控。


圖24. 組蛋白修飾通過(guò)招募特定 reader 進(jìn)而結(jié)合剪接因子從而影響可變剪接 [9]

具體來(lái)講,文獻(xiàn)中還報(bào)道了其他組蛋白修飾的 reader,比如 H3ac、H3K4me3、H3K9me3,也會(huì)招募其他剪接因子,在特定的位點(diǎn)調(diào)控可變剪接。如何發(fā)現(xiàn)組蛋白修飾對(duì)可變剪接的影響?從轉(zhuǎn)錄組層面,如果你關(guān)心特定的組蛋白修飾,你可以看它改變前后一些組蛋白修飾酶的改變,可能會(huì)影響組蛋白修飾的改變,然后進(jìn)行 ChIP-seq,就知道組蛋白修飾分布的情況;再做 RNA-seq,看一下 splicing 的改變??磧烧咧g的關(guān)聯(lián)。進(jìn)行一些分析和驗(yàn)證。在單基因水平上驗(yàn)證,采用 RT-PCR、Northern Blot、ChIP-PCR 等等。這里我們舉一個(gè)例子,是藍(lán)斐老師他們發(fā)現(xiàn)的 H3.3K36me3,通過(guò) BS69 并招募剪接因子復(fù)合物,調(diào)控特定基因的 intron retention。在正常細(xì)胞和 BS69 敲低細(xì)胞中做 RNA-seq,進(jìn)行生信分析,發(fā)現(xiàn) BS69 影響內(nèi)含子保留。
圖25. 轉(zhuǎn)錄組水平系統(tǒng)發(fā)現(xiàn) [10]

為什么呢?植物中的 intron retention 是比較多的,而動(dòng)物中一個(gè)因素改變后,更多的是改變其他的可變剪接類型,比如 exon skipping,但他們發(fā)現(xiàn)的 intron retention 是改變最顯著的,這樣就可以建立 BS69 與 intron retention 的聯(lián)系。而且發(fā)現(xiàn)基因表達(dá)也出現(xiàn)改變,跟我們的結(jié)果也是比較吻合的,而且他們也在單基因水平上進(jìn)行了驗(yàn)證。通過(guò)這個(gè)例子,回答了中間一個(gè)環(huán)節(jié),組蛋白修飾至少可以通過(guò)兩種方式影響 RNA 剪接,那么反過(guò)來(lái)是不是成立的?RNA 剪接會(huì)不會(huì)影響組蛋白修飾呢?


圖 26. 剪接抑制劑可顯著改變 H3K36me3 和 Pol II 分布 [11]

如果要驗(yàn)證可變剪接改變對(duì)組蛋白修飾的影響,首先要改變可變剪接,研究者用了化學(xué)藥物,抑制可變剪接的效率,后來(lái)進(jìn)一步證明,這樣一種藥物模擬了剪接位點(diǎn)的突變,這樣就改變了可變剪接,然后做 ChIP-seq,發(fā)現(xiàn) H3K36me3 分布顯著改變,而且也發(fā)現(xiàn) RNA 聚合酶 II 的分布也發(fā)生了與 H3K36me3 類似的改變,這暗示剪接的改變很可能影響組蛋白修飾,而且很可能與 RNA 聚合酶 II 位置上的變動(dòng)有關(guān)。進(jìn)一步的機(jī)制還不是很清楚,只是提供了中間的線索。但至少證明了一點(diǎn),可變剪接可能影響組蛋白修飾。


圖27. RNA 結(jié)合蛋白可招募組蛋白去乙?;绊懡M蛋白修飾 [12]

在植物中也進(jìn)一步證明了這一點(diǎn),RNA 結(jié)合蛋白會(huì)結(jié)合到不同的序列上,Hu 蛋白會(huì)招募 HDAC,由于這兩者物理位置上的接近,會(huì)對(duì)鄰近的組蛋白的乙?;サ?,通過(guò)這種方式對(duì)組蛋白修飾產(chǎn)生影響?,F(xiàn)在的研究還不是很多,目前的例子也就這些。但已經(jīng)說(shuō)明了一點(diǎn),組蛋白修飾可能影響剪接,剪接也會(huì)影響組蛋白修飾。在有機(jī)體內(nèi),這兩者可能會(huì)進(jìn)一步的相互作用,甚至反饋調(diào)控,可能是正反饋也可能是負(fù)反饋,從而使機(jī)體達(dá)到一種穩(wěn)態(tài)。生物體之間存在各種各樣的聯(lián)系,關(guān)鍵是找到證明其存在的證據(jù)以及其背后的邏輯。

DNA 甲基化與基因可變剪接

既然 DNA 甲基化修飾與可變剪接相關(guān),一個(gè)簡(jiǎn)單的辦法就是對(duì)全基因組 DNA 甲基化進(jìn)行分析。怎么分析呢?分組,分為外顯子和內(nèi)含子,區(qū)別外顯子和內(nèi)含子數(shù)據(jù)哪些是一樣的,哪些是不一樣的。有的 GC 含量一樣,有的不一樣。為了避免 GC 含量因素對(duì)結(jié)果的影響,他們做了一個(gè)設(shè)定,只分析外顯子和內(nèi)含子內(nèi) GC 含量一樣的組別,這樣得出來(lái)的結(jié)論消除 GC 含量的影響,結(jié)果發(fā)現(xiàn)外顯子上有更高的 DNA 甲基化。這個(gè)比較有意思,要看兩者之間是否有相互作用,先看有無(wú)相關(guān)性,有相關(guān)性并不代表有因果關(guān)系。但通常如果有因果關(guān)系,相關(guān)性方面應(yīng)當(dāng)有些線索;如果什么都沒(méi)有,這個(gè)事情就變得更困難。進(jìn)一步分析發(fā)現(xiàn),剪接位點(diǎn)附近的甲基化程度相對(duì)于內(nèi)含子里邊其他的更遠(yuǎn)的地方,水平明顯不一樣。這為我們提供了一個(gè)很好的線索,如果甲基化會(huì)影響 splicing 的話,它在這兩個(gè)不同位置的甲基化程度給它的作用提供了一個(gè)基礎(chǔ)。進(jìn)一步再想,如果 DNA 甲基化可以影響選擇性剪接,那么通過(guò)什么樣的方式?


圖28. 兩種不同的內(nèi)含子-外顯子結(jié)構(gòu) [13]

第一種方式,DNA 甲基化可以間接地通過(guò)影響組蛋白的修飾從而影響剪接。這在理論上是成立的,但實(shí)際能不能找到這樣的例子還未知。另外一個(gè)辦法,我們可以去關(guān)注 DNA 甲基化的結(jié)合蛋白。大家知道,甲基化有專門(mén)的結(jié)合蛋白,類似于組蛋白修飾中的 reader,你也可以認(rèn)為這個(gè)結(jié)合蛋白是 DNA 甲基化的 reader。但與組蛋白修飾有點(diǎn)不一樣,DNA 甲基化之后,某些蛋白對(duì) DNA 的結(jié)合能力不同。有些蛋白質(zhì)不喜歡甲基化,因此 DNA 甲基化之后蛋白質(zhì)不能結(jié)合,有的必須要 DNA 甲基化之后蛋白才結(jié)合。那么一旦蛋白結(jié)合在這個(gè)地方,這些蛋白有沒(méi)有可能通過(guò)下游的因素影響剪接呢?這也許是個(gè)可能。很多研究發(fā)現(xiàn)了介導(dǎo)這一過(guò)程的因素,是一些大家耳熟能詳?shù)囊蜃?,比?CTCF,它與 DNA 甲基化的結(jié)合與它的一個(gè) domain 有關(guān)系。但是大家發(fā)現(xiàn),這個(gè)因子居然同樣可以影響它的剪接;另一個(gè)是 MeCP2,它是一個(gè)甲基化結(jié)合蛋白。這兩個(gè)因子就是剛才講的,一個(gè)通過(guò)結(jié)合在非甲基化序列上影響剪接,一個(gè)通過(guò)結(jié)合在甲基化序列上影響剪接。還有一個(gè)是 HP1,它是組蛋白 H3K9 甲基化 reader。DNA 甲基化修飾影響剪接主要通過(guò)三種機(jī)制來(lái)實(shí)現(xiàn)的:一是改變速率,一旦改變速率,后面的機(jī)制就容易解釋;二是招募剪接因子;三是通過(guò) Pol II 的快慢來(lái)實(shí)現(xiàn),基本是由這三種機(jī)制來(lái)實(shí)現(xiàn)。


圖29. DNA 甲基化通過(guò)三種機(jī)制調(diào)控可變剪接 [13]

第一個(gè)例子中的 CTCF,它的結(jié)合具有序列特異性,CTCF 與特定 DNA 序列結(jié)合后,會(huì)讓 RNA 聚合酶 II 變慢。RNA 聚合酶 II 變慢之后,弱的剪接性號(hào)也能作為外顯子,因此外顯子包含,這個(gè)時(shí)候形成一個(gè)三個(gè)外顯子轉(zhuǎn)錄本。如果這個(gè)地方發(fā)生甲基化,那么 CTCF就沒(méi)有辦法結(jié)合在這個(gè) DNA 序列上。如果 RNA 聚合酶 II 跑的快,由于這個(gè)位點(diǎn)比較弱被剪接掉,實(shí)際上會(huì)造成外顯子跳躍。從原理上來(lái)講,這種作用方式解釋的相對(duì)比較清楚,但卻沒(méi)能解釋在什么情況下這個(gè)位置的 RNA 聚合酶跑的快或慢。那么作為一個(gè) DNA 甲基化結(jié)合蛋白,MeCP2 如何影響 splicing?正好相反。DNA 發(fā)生甲基化,會(huì)促進(jìn) MeCP2 結(jié)合上去,而且 MeCP2 還會(huì)招募一些特定的組蛋白修飾酶,如 HDAC,在下游的因子的作用下,它會(huì)讓 RNA 聚合酶 II 變慢。如何變慢,沒(méi)有解釋清楚,至少給出了一個(gè)線索,就是 MeCP2 結(jié)合上去會(huì)讓 RNA 聚合酶 II 會(huì)變得慢,變慢之后會(huì)造成外顯子正常的切割包含,如果 DNA 沒(méi)有甲基化,MeCP2 不會(huì)與之結(jié)合,RNA 聚合酶 II 快速移動(dòng),造成外顯子跳躍。這兩個(gè)例子都是蛋白結(jié)合在這里造成 RNA 聚合酶轉(zhuǎn)錄或延伸速率,決定外顯子跳躍與否。第三個(gè)例子是通過(guò)組蛋白修飾影響剪接??梢钥吹?,如果 DNA 發(fā)生甲基化,會(huì)進(jìn)一步使組蛋白上發(fā)生 H3K9me3,這種修飾會(huì)招募 HP1。HP1 是一個(gè)識(shí)別 H3K9me3 的蛋白,有了這個(gè)蛋白之后,它會(huì)再去招募 splicing factor。如果這個(gè) splicing factor 是促進(jìn) exon skipping 的,在這個(gè)過(guò)程中,兩個(gè) splicing factor 的位置比較近,促使外顯子發(fā)生跳躍。這個(gè)假設(shè)走了一條很長(zhǎng)的路,很奇怪,從 DNA 修飾到組蛋白修飾,再到 reader,然后再 splicing factor,解釋起來(lái)比較麻煩。這個(gè)機(jī)制給大家的研究造成很大的困難,如果你要證明這個(gè)方式確實(shí)存在,首先要證明是 H3K9 甲基化而不是其他的,接下來(lái)解釋轉(zhuǎn)到 splicing factor,到底結(jié)合哪個(gè) splicing factor,這個(gè)還得去找,這個(gè)給研究帶來(lái)了更大的難度。剛剛講了這三種機(jī)制,大家覺(jué)得從原理上講哪種更普遍,哪種更特異性?從原理上來(lái)講,CTCF 識(shí)別特定序列,只有某些特定基因才有這樣的序列,這樣它可能特異性更強(qiáng);對(duì)于 MeCP2,只要是基因發(fā)生甲基化,它就能與之結(jié)合,對(duì)基因的序列要求沒(méi)有那么高,從而調(diào)控更多基因的剪接;HP1 與它的作用方式類似,因?yàn)樗梢宰R(shí)別 H3K9me3,H3K9me3 在很多核小體上都能存在,因此它對(duì)基因選擇性沒(méi)有那么強(qiáng)。初步的猜想就是 CTCF 調(diào)控的基因更少,后兩者更多一點(diǎn)。好像一切看上去都很完美,很好地解釋了 DNA 甲基化確實(shí)會(huì)影響 splicing,但你仔細(xì)看一下我們之前說(shuō)的關(guān)聯(lián)研究和后面的機(jī)制研究,存在一個(gè)讓人想不通的事情。你看一下被跳掉的 alternative exons,它含有的 DNA 甲基化水平實(shí)際上比其他外顯子的甲基化水平低。但之前我們說(shuō)外顯子上的 DNA 甲基化比較高,我們之前認(rèn)為外顯子高的甲基化水平跟它的剪接是相關(guān)的,DNA 甲基化是 promote 外顯子的定義。但實(shí)際上我們?nèi)タ蠢锩娴臄?shù)據(jù),去推廣這個(gè)假說(shuō),其實(shí)是不成立的。因?yàn)樵谔囟ǖ呐咛ジ杉?xì)胞中看到的現(xiàn)象是 DNA 甲基化可以促進(jìn)或抑制特定 alternative exons inclusion [14]。原來(lái)認(rèn)為簡(jiǎn)單的 DNA 甲基化決定外顯子,實(shí)際上是有的時(shí)候甲基化高的區(qū)域作為外顯子保留,有的時(shí)候又作為內(nèi)含子被切掉,這與假說(shuō)中的情況不完全一樣。


圖30. DNA 甲基化可促進(jìn)或抑制特定 alternative exons inclusion [14]

除了我們講的 alternative exon,其實(shí)還存在一種組成型外顯子 constitute exon。我們看到的甲基化水平高可能只是在組成型外顯子顯示的甲基化水平高,但是如果將組成型和可變的外顯子放在一起比較,與原來(lái)的假設(shè)相矛盾了。實(shí)際上對(duì)于 constitute exon,它更多的是由這個(gè)強(qiáng)的剪接信號(hào)來(lái)決定,這時(shí)甲基化水平高低只是一種伴隨現(xiàn)象,不管甲基化水平高或低,旁邊的 intron 都會(huì)被剪掉。alternative exon 一直都被認(rèn)為是一個(gè)外顯子,甲基化水平可能對(duì)這個(gè)可變外顯子的影響更大,這樣可以更好解釋為什么全基因組水平和單基因水平機(jī)制驗(yàn)證有可能存在矛盾。以上這些分析可以得出一個(gè)初步的結(jié)論,DNA 甲基化通過(guò)多種方式影響 RNA 剪接,那么反過(guò)來(lái)會(huì)不會(huì)成立,根據(jù)前面一個(gè)猜想肯定也是成立,遺憾的是并沒(méi)有這方面證據(jù)。

染色質(zhì)修飾與基因轉(zhuǎn)錄終止

最后稍微再講一點(diǎn),RNA 加工不僅是一個(gè)可變剪接的過(guò)程,還有加 Poly(A) 尾。Poly(A) 尾在哪個(gè)地方加也是非常重要的,很多剪接因子影響加 Poly(A) 尾,兩者關(guān)系密切。表觀遺傳修飾與轉(zhuǎn)錄終止之間有什么關(guān)系?轉(zhuǎn)錄終止提示在哪個(gè)位置加 Poly(A) 尾巴。如圖 31 所示,gene body 有不同修飾,尤其是在 3’-端存在很多組蛋白修飾。那這種特異修飾有沒(méi)有可能與 3’-端的 Poly(A) 尾存在聯(lián)系,答案是肯定的。
圖31. 基因組上不同區(qū)域的組蛋白修飾分布

我們先簡(jiǎn)要了解一下 alternative polyadenylation,之前講過(guò)如果在 3’-UTR 區(qū)選擇不一樣 3’-UTR 長(zhǎng)度,對(duì)蛋白質(zhì)的量會(huì)造成影響,但是 alternative polyadenylation (APA) 也可以影響蛋白質(zhì)的質(zhì)。因?yàn)槿绻?APA 在 intron 區(qū)域,會(huì)使開(kāi)發(fā)閱讀框后面發(fā)生改變,造成蛋白質(zhì) C-端改變,功能可能不一樣。這兩種方式在細(xì)胞內(nèi)廣泛存在并發(fā)揮作用,具體作用非常多。70% 以上基因都存在 APA 現(xiàn)象,它參與很多過(guò)程,像腫瘤、細(xì)胞分化、發(fā)育、組織特異性,而且更有意思的是在細(xì)胞增殖過(guò)程中,增殖比較快的細(xì)胞,癌細(xì)胞或癌旁,更多基因會(huì)選擇近端 APA 位點(diǎn),讓基因表達(dá)量產(chǎn)生明顯的改變,提示這種現(xiàn)象有非常重要的生物學(xué)意義,在這個(gè)過(guò)程中研究如何被表觀遺傳調(diào)控很有意義。
圖32. APA 相關(guān)的生物學(xué)過(guò)程 [15]

通過(guò)組學(xué)手段發(fā)現(xiàn)很多細(xì)胞里面,如果說(shuō)一個(gè)基因有兩個(gè) Poly(A) 位點(diǎn),如果去看這兩個(gè)位點(diǎn)附近各種組蛋白修飾,明顯表現(xiàn)出有很多不同特征,如下圖 33,組蛋白修飾在上游 APA 位點(diǎn)和下游 APA 位點(diǎn)分布很不一樣,H3K36me3 在近端和遠(yuǎn)端 Poly(A) 位點(diǎn)也不一樣,那么這樣一種相關(guān)性其實(shí)提示組蛋白修飾有可能調(diào)控 Poly(A) 位點(diǎn)的選擇。
圖33. 不同 APA 位點(diǎn)的組蛋白修飾 [16]

在植物里面也發(fā)現(xiàn)了類似的現(xiàn)象,組蛋白修飾確實(shí)影響 Poly(A) 位點(diǎn)選擇。比如有兩個(gè)轉(zhuǎn)錄本,選擇近端或者說(shuō)上游端 Poly(A) 位點(diǎn),這個(gè)是常規(guī)的,在這個(gè)附近有很多修飾,既有 DNA 甲基化,又有組蛋白修飾,組蛋白修飾有很多不同的 reader,這些 reader 最后調(diào)控加尾因素的選擇,最后抑制或促進(jìn) Poly(A) 位點(diǎn)選擇,這樣組蛋白修飾或表觀遺傳標(biāo)記對(duì)選擇哪個(gè)地方結(jié)尾有了因果關(guān)系。
圖34. 組蛋白修飾影響 Poly(A) 尾的選擇 [17]

總結(jié)一下,DNA 甲基化、組蛋白修飾、可變剪接之間可以相互影響。影響可變剪接的因素包括順式作用元件本身強(qiáng)弱,和它的反式因子結(jié)合或剪接因子濃度、以及是不是可以影響 RNA 聚合酶 II 的延伸快慢。同時(shí)組蛋白修飾能夠影響 RNA 末端形成,剪接因子不僅影響 RNA 剪接,還影響 RNA 3’-端的形成。但有一點(diǎn)仍不清楚,RNA 剪接發(fā)生之后會(huì)不會(huì)對(duì) DNA 甲基化造成影響。除此之外,RNA 修飾會(huì)不會(huì)對(duì) RNA 剪接造成影響,楊運(yùn)桂老師也講了,特定 RNA 修飾可以通過(guò)改變特定蛋白,最后對(duì) RNA 剪接造成一些影響,而這樣一些影響可以進(jìn)一步來(lái)推,比如說(shuō) RNA 修飾影響 splicing 之后,會(huì)不會(huì)再影響組蛋白修飾,再進(jìn)一步影響甲基化,我覺(jué)得這也是完全有可能的。
圖35. DNA 甲基化、組蛋白修飾、RNA 剪接和 Poly(A) 尾形成的關(guān)系

這樣在中心法則下面 RNA 作為一個(gè)中間傳遞者,在它的水平上發(fā)生一個(gè)很多的調(diào)控,這些調(diào)控不僅對(duì)下面的蛋白質(zhì)造成影響,可能反過(guò)來(lái)影響上游的遺傳物質(zhì),起到一個(gè)很重要的承上啟下的作用,甚至是一個(gè)很中心的位置。RNA 加工過(guò)程中存在很多未知因素,從不同角度去看,會(huì)有很多新的發(fā)現(xiàn),如果能夠把這些新的發(fā)現(xiàn)的一個(gè)上游因素闡述的相對(duì)比較清楚,對(duì)過(guò)程理解會(huì)更深刻。

整理:復(fù)旦大學(xué)生物醫(yī)學(xué)研究院徐鵬、重慶醫(yī)科大學(xué)蔡瑩、中科院上海藥物所徐曉偉
責(zé)編:復(fù)旦大學(xué)生物醫(yī)學(xué)研究院徐鵬
參考文獻(xiàn):1. Wang, Y., et al., The splicing factor RBM4 controls apoptosis, proliferation, and migration to suppress tumor progression. Cancer Cell,2014. 26(3): p. 374-389.
2. Di Giammartino,D.C., K. Nishida, and J.L. Manley, Mechanisms and consequences of alternative polyadenylation. Mol Cell, 2011. 43(6): p. 853-66.
3. Mayr, C. andD.P. Bartel, Widespread shortening of 3'UTRs by alternative cleavage and polyadenylation activates oncogenes in cancer cells. Cell, 2009. 138(4):p. 673-84.
4. Mortazavi, A., et al., Mapping and quantifying mammalian transcriptomes by RNA-Seq.Nat Methods, 2008. 5(7): p. 621-8.
5. Trapnell, C., et al., Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. NatProtoc, 2012. 7(3): p. 562-78.
6. Fu, X.-D. and M.Ares Jr, Context-dependent control of alternative splicing by RNA-binding proteins. Nature Reviews Genetics,2014. 15: p. 689.
7. Kornblihtt, A.R., Promoter usage and alternative splicing. Current opinion in cell biology, 2005. 17(3): p. 262-268.
8. Barth, T.K. and A. Imhof, Fast signals and slow marks: the dynamics of histone modifications. Trends Biochem Sci, 2010. 35(11): p. 618-26.
9. Luco, R.F., et al., Epigenetics in alternative pre-mRNA splicing. Cell, 2011. 144(1): p.16-26.
10. Guo, R., et al., BS69/ZMYND11 reads and connects histone H3.3lysine 36 trimethylation-decorated chromatin to regulated pre-mRNA processing.Mol Cell, 2014. 56(2): p. 298-310.
11. Kim, S., et al., Pre-mRNA splicing is a determinant of histone H3K36 methylation. Proc Natl Acad Sci U S A, 2011. 108(33): p. 13564-9.12. Zhou, H.L., et al., Regulation of alternative splicing by local histone modifications: potential roles for RNA-guided mechanisms.Nucleic Acids Res, 2014. 42(2): p.701-13.
13. Lev Maor, G., A.Yearim, and G. Ast, The alternative role of DNA methylation in splicing regulation. Trends Genet, 2015. 31(5): p. 274-80.
14. Yearim, A., et al., HP1 is involved in regulating the global impact of DNA methylation on alternative splicing. Cell Rep, 2015. 10(7): p. 1122-34.
15. Elkon, R., A.P.Ugalde, and R. Agami, Alternative cleavage and polyadenylation: extent, regulation and function. Nat Rev Genet, 2013. 14(7): p. 496-506.
16. Ji, Z., et al., Transcriptional activity regulates alternative cleavage and polyadenylation. Mol Syst Biol, 2011. 7: p. 534.
17. Mathieu, O. andN. Bouche, Interplay between chromatin and RNA processing. Curr Opin Plant Biol, 2014. 18: p. 60-5.

推薦閱讀:
表觀遺傳,你想了解的都在這里

騰訊視頻鏈接: 復(fù)旦倪挺:表觀遺傳調(diào)控與可變剪接

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請(qǐng)通過(guò)簡(jiǎn)信或評(píng)論聯(lián)系作者。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容