首先,在進(jìn)入正題之前,有必要介紹一下TCGA(The Cancer Genome Atlas)數(shù)據(jù)庫的建立,和它帶給腫瘤學(xué)研究的歷史性變革(PS:用四個(gè)堿基的縮寫來命名這個(gè)項(xiàng)目真是不能再妙了!)。直白的說, 進(jìn)入21 世紀(jì)以來,個(gè)性化醫(yī)療的產(chǎn)生使人類對腫瘤的診斷和治療早已不再停留在簡單的表觀階段,人們渴望通過“上帝視角”來探索腫瘤產(chǎn)生和轉(zhuǎn)移的根本基因?qū)W根源,而Next-generation sequencing 的發(fā)展使得高效的全基因組測序成為了可能。在這樣的大背景下,NCI和 NHGRI 在2005 年發(fā)起了 TCGA project,在十多年的歷程中,TCGA收錄了美國和加拿大地區(qū) 11,000 多個(gè)病人樣本,涵蓋33 個(gè)腫瘤亞型,約 2.5 PB 的腫瘤樣本高通量基因組測序結(jié)果。生物信息分析結(jié)合收錄的病人診斷和治療信息,腫瘤病理學(xué)信息,對腫瘤學(xué)的研究推進(jìn)可以說是質(zhì)的飛躍。在這之后,多個(gè)國家先后發(fā)起了類似的項(xiàng)目,于是在人類用智慧與腫瘤做斗爭的同時(shí),也隨之產(chǎn)生了很多意外而有意思的發(fā)現(xiàn)。
1. 偽裝者:披著乳腺癌外表的”卵巢癌“
之所以把它放在第一位,那是因?yàn)樗墒荰CGA 宣傳手冊上的官方事例,原文的描述是"surprising new
findings"。這篇文章的出處是 2012 年TCGA 團(tuán)隊(duì)在 Nature 上發(fā)表的對乳腺癌亞型的綜合分析。原文請戳Comprehensivemolecular portraits of human breast tumours.
在個(gè)性化醫(yī)療發(fā)展之前,人們在給腫瘤下定義時(shí),一般都會習(xí)慣性把一個(gè)器官或者組織上發(fā)生的腫瘤歸為一類,無論亞型一不一致,診斷或者治療都會在這個(gè)大背景下去展開。例如在乳腺癌中,有四種病理學(xué)亞型Luminal A, Luminal B, HER2+, Basal-like. 前兩者一般都有高ER 和 PR 表達(dá),于是Hormone therapy 再合適不過,HER2+ 腫瘤的治療也隨著單抗類藥物Herceptin 的研發(fā)而逐漸明朗,但是basal-like(三陰性)乳腺癌確一直找不到一個(gè)明確的治療方法,更多時(shí)候只是普通的化療。簡單地說,在這項(xiàng)研究中,科學(xué)家通過相關(guān)性分析,發(fā)現(xiàn)Basal-like 這一亞型的基因表達(dá)譜和其他三種亞型大相徑庭,但是卻和惡性卵巢癌和鱗狀上皮肺癌組織的基因表達(dá)有著高度的相似性。
[if !vml]
[endif]
這圖來自原文的Figure5b,四列是 TCGA 對四種乳腺癌亞型的基因表達(dá),七行是來自于另一個(gè)數(shù)據(jù)庫GSE2109 中的七中不同部位腫瘤的基因表達(dá),圖中的顏色代表這一行和這一列腫瘤組織基因表達(dá)的相關(guān)性,黃色為高度相似,藍(lán)色為高度差異。我們可以看到在Basal 這一列中,除了和乳腺癌樣本中的 Basal 部分高度相似意外,還和惡性卵巢癌,以及肺癌中鱗狀上皮亞型的那部分有著高度的基因表達(dá)相似性。但是和乳腺癌的其他亞型去比卻是一片藍(lán)。簡而言之,這個(gè)在臨床上死亡率頗高的亞型簡直就是在披著乳腺癌的外表蠱惑人心,實(shí)則和卵巢癌以及肺癌高度相似!
有什么意義?因?yàn)槿幮匀橄侔┏薆RCA1/2 和 TP53 之外并沒有什么令人驚喜的driver mutation, 但是由于 gene
amplification 和信號通路的高度相似性,所以給人們的啟發(fā)是可以考慮用治療惡性卵巢癌的方法去嘗試這一亞型。其實(shí)近幾年類似的研究還有很多,例如食道癌和頭頸部癌癥也有高度相似性。
這些發(fā)現(xiàn)的重要意義在于,人們今后對腫瘤的分類將會不再簡單從組織和器官的亞型出發(fā),而是直接用Gene siganture 去定義,并且至今從基因表達(dá)譜去關(guān)聯(lián)腫瘤的治療方案。
2. 蝴蝶效應(yīng):一個(gè)堿基突變引起的全基因組重編程風(fēng)暴
想象一下,在你的體細(xì)胞的23 對染色體的基因組內(nèi),有著約三十億個(gè)堿基對,而三十億分之一的概率下,某一個(gè)細(xì)胞的某一個(gè)堿基發(fā)生了某一個(gè)點(diǎn)突變,瞬間引起了這個(gè)細(xì)胞整個(gè)基因表達(dá)譜中上萬個(gè)基因表達(dá)程度發(fā)生劇變,而劇變的后果就是造成了這個(gè)突變細(xì)胞從此開掛,在腫瘤產(chǎn)生和轉(zhuǎn)移的大路上勢如破竹。
這一系列驚為天人的連鎖反應(yīng),其實(shí)對于生物信息學(xué)研究者來說并不意外,但是的確讓人細(xì)思極恐。那么,一個(gè)堿基的突變是怎么產(chǎn)生這個(gè)蝴蝶效應(yīng)的呢?
舉個(gè)我比較熟悉的例子吧,還是乳腺癌。2013年來,通過對臨床腫瘤組織的基因組測序,人們發(fā)現(xiàn)在雌激素受體陽性的乳腺癌樣本中,有30% 的病人樣本在芳香化酶抑制劑治療后會在雌激素受體第八個(gè)外顯子的一個(gè)特定位點(diǎn)出現(xiàn)一個(gè)熱點(diǎn)突變(對應(yīng)雌激素受體蛋白序列上的AF2 domain)。最常見的就是 ESR1 基因DNA 上 1610 位的A 會突變?yōu)?C,而這個(gè)簡單的單一堿基突變會繼而引起雌激素受體蛋白序列發(fā)生錯(cuò)義突變,第537 位的酪氨酸會突變?yōu)榻z氨酸(Y537S),而這樣突變的后果就是在功能上造成了雌激素受體不依賴于雌激素的持續(xù)激活。由于雌激素受體是個(gè)著名的核內(nèi)轉(zhuǎn)錄因子,整個(gè)基因組上有約100000 個(gè)雌激素受體轉(zhuǎn)錄結(jié)合元件,雌激素受體的轉(zhuǎn)錄調(diào)控對這些基因而言,有的是抑制轉(zhuǎn)錄,有的是增強(qiáng)轉(zhuǎn)錄,而這些基因又會去改變它們關(guān)系密切的其他基因,這樣一傳十,十傳百,上萬個(gè)基因表達(dá)量的改變可想而知。下面就放個(gè)heatmap 證明一下。
[if !vml]
[endif]
圖出自2016 年 10 月剛剛出爐的文章,Simak
Ali 課題組用 Cripsr/cas9 構(gòu)建了基因組層面編輯的雌激素受體基因ESR1 上 A1610C 的突變細(xì)胞模型(Y537S),和野生型的細(xì)胞一起做了RNA 測序。熱圖很直觀,藍(lán)色代表低表達(dá),紅色代表高表達(dá),每一行都是一個(gè)基因。相信肉眼就能給人足夠的沖擊力,上萬個(gè)基因表達(dá)的區(qū)別僅僅來自于一個(gè)堿基的突變!
感慨一下,這就是腫瘤,一個(gè)擁有不可思議的微觀超能力,并且不斷奪走人類生命的撒旦。
3. 隱藏的殺意:沉默突變在腫瘤中不再沉默
先不多說,放一個(gè)截屏。
[if !vml]
[endif]
這是一個(gè)可以讓NCS 三大主流期刊同時(shí)發(fā)文的話題。沉默突變,顧名思義,就是堿基發(fā)生了突變,但是其編碼的氨基酸并未改變。腫瘤研究的很長一段時(shí)間里,科學(xué)家的目光都放在了錯(cuò)義或者無義突變上。這本身看來非常有道理,那些經(jīng)典的driver mutation 都是錯(cuò)義突變導(dǎo)致蛋白產(chǎn)物功能改變的結(jié)果。沉默突變嘛,一如既往的沉默在人們的視線中。
但是,隨著高通量測序的發(fā)展,人們開始意識到,這些沉默突變明明十分危險(xiǎn)。一個(gè)基因上的沉默突變對腫瘤生長和轉(zhuǎn)移的影響多種多樣。這里簡單舉兩個(gè)例子。
第一個(gè)例子來自于2006 年一篇 Science 的文章。A
"Silent" Polymorphism in the MDR1 Gene Changes Substrate Specificity。文章的最驚人之處在于點(diǎn)出了為什么沉默突變,也能造成兩個(gè)氨基酸序列一模一樣的蛋白擁有功能變化。文章關(guān)注于著名的編碼外排泵蛋白p-gp 的耐藥基因 MDR1 上點(diǎn)C3435T 沉默突變,他們發(fā)現(xiàn)這個(gè)突變的雖然沒有改變蛋白上的氨基酸序列,但是由于蛋白翻譯系統(tǒng)對這個(gè)密碼子的識別速度較慢,導(dǎo)致了整個(gè)蛋白的翻譯過程變慢,從而在內(nèi)質(zhì)網(wǎng)和高爾基體中發(fā)生折疊時(shí)的構(gòu)想發(fā)生了輕微變化,最終導(dǎo)致了p-gp 蛋白的外排作用更強(qiáng),從而使得腫瘤細(xì)胞更加耐藥。
第二個(gè)例子來自于2005 年的一篇 PNAS,(http://www.pnas.org/content/102/18/6368.short).一個(gè)意大利課題組關(guān)注了囊胞性纖維綜合癥的關(guān)鍵調(diào)控基因CFTR 位于第 12 外顯子邊緣的一個(gè)沉默突變。他們發(fā)現(xiàn)這個(gè)沉默突變引起蛋白改變的關(guān)鍵步驟在于成熟mRNA 的切割,由于負(fù)責(zé) RNA 切割的內(nèi)切酶無法識別這個(gè)突變后的轉(zhuǎn)錄產(chǎn)物,所以直接導(dǎo)致了第12 外顯子的所有編碼序列被全部切除,繼而蛋白也發(fā)生了失活,失去了調(diào)控元件以后一切都有利于囊胞性纖維綜合癥的惡化方向發(fā)展,腫瘤也就不期而至。
其實(shí)還有很多其他研究發(fā)現(xiàn)了不同的機(jī)制,例如沉默突變的引入直接改變了DNA 的甲基化,在表觀遺傳層面就發(fā)生了區(qū)別。
我們都知道腫瘤的產(chǎn)生離不開突變,可是面對無處不在的突變,真正的殺手實(shí)在撲朔迷離。
以上幾個(gè)比較有意思的例子,都是我在平時(shí)的研究中所碰到的,也算在此拋磚引玉。
最后,引用一句話吧。來自腫瘤基因組研究領(lǐng)域世界公認(rèn)的領(lǐng)袖級科學(xué)家,英國桑格研究院(Wellome
Trust Sanger Institute)主任 Sir
Michael Stratton (在英國當(dāng)一個(gè)科學(xué)家被冠以“Sir”的頭銜,已然超然世外),我有幸在2016 年的波特蘭國際乳腺癌研究大會上聽過他的報(bào)告,并和他有過交流,他當(dāng)時(shí)的一句話十分有震撼力,大概的意思是:“在人基因組中只有2% 的部分編碼蛋白,但是腫瘤的突變卻涵蓋了整個(gè)基因組,有錯(cuò)義的,有無義的,也有沉默的。對腫瘤的斗爭需要人們突破傳統(tǒng)的生物學(xué)觀念,用更加長遠(yuǎn)而廣闊的視野去分析和看待基因組和突變。腫瘤不可怕,可怕的是停滯不前的目光。”