這次分享的是來自癌癥基因組圖譜計(jì)劃(TCGA)研究網(wǎng)絡(luò)在2008年發(fā)表在nature(IF:49.962, 2020)上的文章Comprehensive genomic characterization defines human glioblastoma genes and core pathways。
注:附圖附表感興趣可去nature官網(wǎng)下載(https://www.nature.com/articles/nature07385#additional-information)
摘要
人類癌細(xì)胞通常含有多種染色體畸變、核苷酸替換和表觀遺傳修飾,這些都會(huì)導(dǎo)致惡性轉(zhuǎn)化。癌癥基因組圖譜(TCGA)試點(diǎn)項(xiàng)目旨在評(píng)估大規(guī)模多維分析這些分子特征在人類癌癥中的價(jià)值,并快速向研究界提供數(shù)據(jù)。在這里,我們報(bào)告了206例膠質(zhì)母細(xì)胞瘤(最常見的成人原發(fā)性腦癌類型)的DNA拷貝數(shù)、基因表達(dá)和DNA甲基化畸變的臨時(shí)綜合分析,以及206例膠質(zhì)母細(xì)胞瘤中91例的核苷酸序列畸變。該分析為RBB2、NF1和TP53的作用提供了新的見解,揭示了磷脂酰肌醇-3-OH激酶調(diào)節(jié)亞基基因PIK3R1的頻繁突變,并提供了膠質(zhì)母細(xì)胞瘤發(fā)生過程中改變的途徑的網(wǎng)絡(luò)視圖。此外,突變、DNA甲基化和臨床治療數(shù)據(jù)的整合揭示了在治療的膠質(zhì)母細(xì)胞瘤中由于錯(cuò)配修復(fù)缺陷而導(dǎo)致的GMT促甲基化和高突變表型之間的聯(lián)系,這一觀察結(jié)果具有潛在的臨床意義。總之,這些發(fā)現(xiàn)證實(shí)了TCGA的可行性和威力,證明它可以快速擴(kuò)展癌癥分子基礎(chǔ)的知識(shí)。
癌癥是一種基因組改變的疾?。?strong>DNA序列改變、拷貝數(shù)畸變、染色體重排和DNA甲基化修飾共同推動(dòng)人類惡性腫瘤的發(fā)展和進(jìn)展。隨著人類基因組的完整測(cè)序和高通量基因組技術(shù)的不斷改進(jìn),現(xiàn)在可以考慮對(duì)人類癌癥基因組進(jìn)行全面調(diào)查。癌癥基因組圖譜旨在通過整合的多維分析,對(duì)大組人類腫瘤中主要的致癌基因組改變進(jìn)行分類和發(fā)現(xiàn)。
TCGA研究的第一種癌癥是膠質(zhì)母細(xì)胞瘤(世界衛(wèi)生組織IV級(jí)),這是成年人最常見的原發(fā)性腦瘤。原發(fā)性膠質(zhì)母細(xì)胞瘤占活檢或切除病例的90%以上,無低度惡性腫瘤病史,而繼發(fā)性膠質(zhì)母細(xì)胞瘤是從先前診斷的低度惡性膠質(zhì)瘤發(fā)展而來的。新診斷的膠質(zhì)母細(xì)胞瘤患者的中位生存期約為1年,對(duì)所有治療方法的反應(yīng)通常較差。二十年的分子研究已經(jīng)確定了人類膠質(zhì)母細(xì)胞瘤中的重要遺傳事件,包括以下方面:(1)通過受體酪氨酸激酶(RTK)基因的擴(kuò)增和突變激活導(dǎo)致生長(zhǎng)因子信號(hào)傳導(dǎo)失調(diào)。(2)磷脂酰肌醇-3-OH激酶(PI3K)途徑的激活;和(3)p53和視網(wǎng)膜母細(xì)胞瘤腫瘤抑制通路的失活。最近的全基因組分析研究也表明,膠質(zhì)母細(xì)胞瘤之間存在顯著的基因組異質(zhì)性,并且膠質(zhì)母細(xì)胞瘤中存在分子亞類,這些亞類在完全確定后可能允許治療的分層。盡管是片段性的,這種膠質(zhì)母細(xì)胞瘤遺傳學(xué)的基礎(chǔ)知識(shí)為探索是否可以從膠質(zhì)母細(xì)胞瘤基因組的更系統(tǒng)的檢查中獲得新的見解奠定了基礎(chǔ)。
結(jié)果
數(shù)據(jù)發(fā)布。作為公共資源,所有TCGA數(shù)據(jù)都存放在數(shù)據(jù)協(xié)調(diào)中心(DCC)供公眾訪問(http://cancergenome.nih.gov/)。TCGA數(shù)據(jù)按數(shù)據(jù)類型(例如,臨床、突變、基因表達(dá))和數(shù)據(jù)級(jí)別進(jìn)行分類,以允許在適當(dāng)?shù)幕颊唠[私保護(hù)下對(duì)該資源進(jìn)行結(jié)構(gòu)化訪問。補(bǔ)充方法中提供了數(shù)據(jù)組織的概述,TCGA數(shù)據(jù)入門中提供了詳細(xì)說明(http://tcga-data. nci.nih.gov/docs/TCGA_Data_Primer.pdf)。
生物樣本收集
根據(jù)手術(shù)病理報(bào)告和臨床記錄,對(duì)新診斷的膠質(zhì)母細(xì)胞瘤進(jìn)行回顧性生物樣本庫篩選(補(bǔ)充圖1)。進(jìn)一步選擇具有匹配正常組織以及相關(guān)人口統(tǒng)計(jì)學(xué)、臨床和病理學(xué)數(shù)據(jù)的樣本(補(bǔ)充表1)。在Biospecimen核心資源(BCR)處審查相應(yīng)的冷凍組織,以確保至少80%的腫瘤細(xì)胞核和最多50%的壞死(補(bǔ)充圖1)。從合格的生物樣品中提取的DNA和RNA在分發(fā)給TCGA中心進(jìn)行分析之前接受額外的質(zhì)量控制測(cè)量(補(bǔ)充方法)(補(bǔ)充圖2)。
基于腫瘤含量不足(n=234)和核酸質(zhì)量或數(shù)量不理想(n=147)排除后,篩選的587個(gè)生物樣本中的206個(gè)(35%)符合拷貝數(shù)、表達(dá)和DNA甲基化分析的條件。其中143例符合正常外周血或正常組織DNA,因此適合重新測(cè)序。該隊(duì)列還包括21例用于探索性比較的治療后膠質(zhì)母細(xì)胞瘤病例(Supplementary Table 1)。盡管在其余185例新診斷的膠質(zhì)母細(xì)胞瘤中可能有少量進(jìn)行性繼發(fā)性膠質(zhì)母細(xì)胞瘤,但該隊(duì)列主要代表原發(fā)性膠質(zhì)母細(xì)胞瘤。事實(shí)上,與已發(fā)表的隊(duì)列相比,TCGA中新診斷的膠質(zhì)母細(xì)胞瘤病例的總體存活率與文獻(xiàn)中報(bào)道的原發(fā)性膠質(zhì)母細(xì)胞瘤相似(補(bǔ)充圖3,P=0.2)
基因組和轉(zhuǎn)錄畸變
在三個(gè)微陣列平臺(tái)(補(bǔ)充方法)上測(cè)量基因組拷貝數(shù)改變(CNA),并使用多種分析算法進(jìn)行分析(補(bǔ)充圖4和補(bǔ)充表2-4)。除了眾所周知的改變外,我們還檢測(cè)到以前在膠質(zhì)母細(xì)胞瘤中未報(bào)道過的顯著復(fù)發(fā)性局灶性改變,例如涉及NF1和PARK2的純合子缺失,以及AKT3的擴(kuò)增(圖1a和補(bǔ)充表2-4)。對(duì)信息豐富但不常見的CNA的搜索也發(fā)現(xiàn)了罕見的焦點(diǎn)事件,如FGFR2和IRS2的擴(kuò)增和TPRD的刪除(補(bǔ)充表4)。蛋白質(zhì)編碼基因和非編碼microRNA的豐度也通過轉(zhuǎn)錄物特異性和外顯子特異性探針在多個(gè)平臺(tái)上測(cè)量(補(bǔ)充方法)。由此產(chǎn)生的綜合基因表達(dá)數(shù)據(jù)集顯示,復(fù)發(fā)性CNA中76%的基因具有與拷貝數(shù)相關(guān)的表達(dá)模式(補(bǔ)充表2)。此外,基于單核苷酸多態(tài)性(SNP)的分析也對(duì)拷貝中性雜合性丟失(LOH)進(jìn)行了分類,最顯著的區(qū)域是17p,其中包含STP53(補(bǔ)充方法)。

圖1 | 顯著拷貝數(shù)畸變和體細(xì)胞突變模式。a、 焦點(diǎn)高水平CNA的頻率和意義。每個(gè)重要CNA都列出了已知和假定的目標(biāo)基因,“基因數(shù)量”表示每個(gè)焦點(diǎn)CNA邊界內(nèi)的基因總數(shù)。b、 c,在根據(jù)治療狀態(tài)分離的91例膠質(zhì)母細(xì)胞瘤樣本中,沉默(b)和非沉默(c)突變的數(shù)量分布,顯示19例治療樣本中有7例出現(xiàn)超突變。d、 91例膠質(zhì)母細(xì)胞瘤中的顯著突變基因。這里顯示了獲得錯(cuò)誤發(fā)現(xiàn)率0.1的八個(gè)基因。未處理樣本中發(fā)生的體細(xì)胞突變呈深藍(lán)色;在接受治療的隊(duì)列中,在統(tǒng)計(jì)上非超突變和超突變樣本中發(fā)現(xiàn)的分別為淺藍(lán)色。記錄每組的事件數(shù)。
膠質(zhì)母細(xì)胞瘤中的體細(xì)胞核苷酸改變模式
從143例病例中選擇91對(duì)匹配的腫瘤-正常對(duì)(72例未治療病例和19例治療病例),檢測(cè)601個(gè)選定基因的體細(xì)胞突變(補(bǔ)充表5)。由此產(chǎn)生的序列總計(jì)9700萬個(gè)堿基對(duì)(每個(gè)樣本116.1萬個(gè)堿基),在223個(gè)獨(dú)特基因中發(fā)現(xiàn)了453個(gè)經(jīng)驗(yàn)證的非沉默體細(xì)胞突變,其中79個(gè)包含兩個(gè)或更多事件(補(bǔ)充表6;另見http://tcga-data.nci.nih.gov/docs/somatic_mutations/tcga_mutations.htm)。背景突變率在未治療和治療的膠質(zhì)母細(xì)胞瘤之間存在顯著差異,每個(gè)樣本的平均體細(xì)胞沉默突變率分別為1.4和5.8(72例未治療病例中的98個(gè)事件,19例治療病例中的111個(gè)事件,P<10-21)。這種差異主要由七個(gè)超突變樣本驅(qū)動(dòng),由沉默和非沉默突變的頻率確定(圖1b,c)。7例高突變腫瘤中有4例來自先前使用替莫唑胺治療的患者,3例來自單獨(dú)或聯(lián)合使用CCNU(洛莫司汀)治療的患者(補(bǔ)充表1b)。在三個(gè)具有MSH6突變的膠質(zhì)母細(xì)胞瘤標(biāo)本中描述了膠質(zhì)母細(xì)胞瘤的高突變表型,這促使我們對(duì)參與錯(cuò)配修復(fù)(MMR)的基因進(jìn)行系統(tǒng)分析。事實(shí)上,七個(gè)超突變樣本中有六個(gè)在至少一個(gè)MMR基因MLH1、MSH2、MSH6或者PMS2中存在突變,而八十四個(gè)非超突變樣本中只有一個(gè)樣本(P<7 * 10-28),這表明在這些來自治療患者的高度突變樣本中,DNA修復(fù)能力降低。
通過對(duì)突變顯著性進(jìn)行統(tǒng)計(jì)分析,我們發(fā)現(xiàn)8個(gè)基因發(fā)生了顯著突變(錯(cuò)誤發(fā)現(xiàn)率<10-3)(圖2d和補(bǔ)充表6)。有趣的是,在72例未經(jīng)治療的膠質(zhì)母細(xì)胞瘤中檢測(cè)到27例TP53突變(37.5%),在19例經(jīng)治療的樣本中檢測(cè)到11例突變(58%)。所有這些突變都聚集在DNA結(jié)合域,這是人類癌癥中p53突變的一個(gè)眾所周知的熱點(diǎn)(補(bǔ)充圖5和補(bǔ)充表6)。鑒于原發(fā)性膠質(zhì)母細(xì)胞瘤在這一新診斷的集合中占優(yōu)勢(shì),這一結(jié)果明確證明p53突變是原發(fā)性膠質(zhì)母細(xì)胞瘤中的常見事件。

圖2 | F1腫瘤抑制基因和GFR家族成員的突變。a、 91例膠質(zhì)母細(xì)胞瘤的NF1體突變。觀察到錯(cuò)義突變和截?cái)酂o義、移碼和剪接位點(diǎn)突變。剪接位置是根據(jù)人類基因突變數(shù)據(jù)庫中的F1參考轉(zhuǎn)錄本編號(hào)的最近外顯子(e#)的堿基數(shù)給出的;陽性表示39個(gè)外顯子,陰性表示59個(gè)外顯子。星號(hào)表示終止密碼子。fs,移幀。b、 基因座的拷貝數(shù)和突變狀態(tài)與表達(dá)水平(yaxis)的相關(guān)性。預(yù)測(cè)導(dǎo)致較少表達(dá)拷貝(包括缺失、無義、剪接位點(diǎn)和移碼突變)的突變事件通常具有較低的觀察表達(dá)。純合子缺失;單拷貝丟失;中性,拷貝數(shù)無變化(假定為二倍體);Amp,增加了拷貝數(shù)。按照補(bǔ)充信息中的描述,確定每個(gè)樣本中THNF1基因座的拷貝數(shù)狀態(tài)。c、 TCGA樣本TCGA-08-0356(紅色)、TCGA-02-0064(藍(lán)色)和TCGA-02-0529(綠色)在GFRLocus的DNA拷貝數(shù)和mRNA表達(dá)譜。上面板顯示分段DNA拷貝數(shù)(基于Affymetrix SNP6)。0數(shù)據(jù))和7號(hào)染色體上的基因組坐標(biāo)。下面板顯示了來自Affymetrix外顯子陣列的已知外顯子的相對(duì)外顯子表達(dá)水平,按基因組位置排序,其中相對(duì)表達(dá)是外顯子強(qiáng)度和基因強(qiáng)度的中間集中差異。格弗涅模型位于兩個(gè)圖之間。黑線描繪了外顯子2至7和26至28的基因組位置。請(qǐng)注意,結(jié)構(gòu)缺失導(dǎo)致外顯子2-7在綠色和藍(lán)色樣本中的表達(dá)相對(duì)較低,而外顯子26-28在紅色樣本中的表達(dá)相對(duì)較低。d、 91例膠質(zhì)母細(xì)胞瘤中的ERBB2體細(xì)胞突變。在膠質(zhì)母細(xì)胞瘤的細(xì)胞外區(qū)域可見突變簇。剪接位點(diǎn)突變位置以最接近外顯子(e#)的堿基數(shù)表示;外顯子陽性
NF1是一個(gè)人類膠質(zhì)母細(xì)胞瘤抑制基因
盡管在一小系列人類膠質(zhì)母細(xì)胞瘤腫瘤中報(bào)道了NF1的體細(xì)胞突變,但其作用仍有爭(zhēng)議,盡管在小鼠模型系統(tǒng)中有大量的遺傳數(shù)據(jù)。在13個(gè)樣本(91個(gè)樣本中的14%)中發(fā)現(xiàn)了19個(gè)NF1體細(xì)胞突變,包括6個(gè)無義突變,4個(gè)剪接位點(diǎn)突變,5個(gè)錯(cuò)義變化和4個(gè)移碼插入/刪除(indels)(圖2a)。其中五種突變——R1391S(參考文獻(xiàn)23)、R1513(參考文獻(xiàn)24)、e2521和e2911(參考文獻(xiàn)25)以及Q1966(參考文獻(xiàn)26)——已被報(bào)告為神經(jīng)纖維瘤病患者的種系改變,因此可能失活。此外,在206例病例的整個(gè)臨時(shí)樣本集中觀察到30個(gè)雜合缺失,其中6個(gè)還存在點(diǎn)突變(補(bǔ)充表8和9)。一些樣本也表現(xiàn)出表達(dá)缺失,沒有基因組改變的證據(jù)(圖2b)??偟膩碚f,206例患者樣本中至少有47例(23%)存在體細(xì)胞NF1激活突變或缺失,明確說明NF1與散發(fā)性人類膠質(zhì)母細(xì)胞瘤的相關(guān)性。
EGFR家族活化的患病率
EGFR在原發(fā)性膠質(zhì)母細(xì)胞瘤中經(jīng)常被激活。除了胞外結(jié)構(gòu)域點(diǎn)突變和胞質(zhì)結(jié)構(gòu)域缺失28,29外,胞外結(jié)構(gòu)域的變體III缺失(“vIII突變體”)27是最常見的描述事件,高分辨率基因組和外顯子特異性轉(zhuǎn)錄組分析很容易檢測(cè)到vIII和羧基末端缺失,并相應(yīng)改變轉(zhuǎn)錄物(圖2c)。在91例具有體細(xì)胞突變數(shù)據(jù)的膠質(zhì)母細(xì)胞瘤病例中,22例存在野生型EGFR的局灶性擴(kuò)增,無點(diǎn)突變,16例存在除局灶性擴(kuò)增外的點(diǎn)突變,3例存在EGFR點(diǎn)突變但無擴(kuò)增(補(bǔ)充圖6和補(bǔ)充表9)。在91個(gè)測(cè)序樣本中,共有41個(gè)樣本出現(xiàn)EGFR畸變。
人膠質(zhì)母細(xì)胞瘤PI3K復(fù)合體的體細(xì)胞突變。
PI3K復(fù)合物由催化活性蛋白p110a(由PIK3CA編碼)和調(diào)節(jié)蛋白p85a(由PIK3R1編碼)組成。據(jù)報(bào)道,在多種腫瘤類型中,包括膠質(zhì)母細(xì)胞瘤,都存在PIK3CA的頻繁激活錯(cuò)義突變。這些突變主要發(fā)生在適配器結(jié)合域(ABD)以及C2螺旋和激酶域中。事實(shí)上,在91個(gè)測(cè)序樣本中的6個(gè)樣本中檢測(cè)到PIK3CA同源核苷酸替換(補(bǔ)充表6)。除了COSMIC數(shù)據(jù)庫(http://
www.sanger.ac.uk/genetics/CGP/cosmic/),在PIK3CA的適配器結(jié)合域中檢測(cè)到兩種新的框架內(nèi)缺失(“L10del”和“P17del”)。這些缺失可能破壞P110α與其調(diào)節(jié)亞單位p85a之間的相互作用(參考文獻(xiàn)37)。
與PIK3CA不同,PIK3R1在癌癥中很少被報(bào)道為突變。在癌癥38,39中報(bào)道的五種PIK3R1核苷酸替換中,一種是膠質(zhì)母細(xì)胞瘤39。在我們的TCGA隊(duì)列中,在91例已測(cè)序的膠質(zhì)母細(xì)胞瘤中檢測(cè)到9例PIK3R1體細(xì)胞突變。沒有一個(gè)樣本含有PIK3含量。在9個(gè)突變中,8個(gè)位于中間的SH2(或iSH2)結(jié)構(gòu)域內(nèi),4個(gè)是3-bp的框內(nèi)缺失(圖3a和補(bǔ)充表6)。根據(jù)PI(3)K的晶體結(jié)構(gòu),其識(shí)別p85aas中的D560和N564氨基酸殘基與p110a C2結(jié)構(gòu)域中的N345氨基酸殘基的接觸點(diǎn)(參考文獻(xiàn)37),在膠質(zhì)母細(xì)胞瘤中檢測(cè)到的突變聚集在這三個(gè)氨基酸殘基周圍(圖3b),包括IK3CA的N345K突變(以前在結(jié)腸癌和乳腺癌中報(bào)道過40)和IK3R1的D560Y和N564K突變。除了兩個(gè)關(guān)鍵殘基附近的其他三個(gè)新的缺失(R574del、T576del和W583del),我們還發(fā)現(xiàn)了一個(gè)18 bp的缺失,跨越了PIK3R1(圖3b)中的殘基D560到S565(DKRMNS)。我們推測(cè),由于這些缺失導(dǎo)致的空間限制可能會(huì)阻止p85aN末端SH2(nSH2)結(jié)構(gòu)域與p110a螺旋結(jié)構(gòu)域的抑制性接觸,從而導(dǎo)致組成性PI3K活性。
與PIK3CA不同,PIK3R1在癌癥中很少被報(bào)道為突變。在癌癥中報(bào)道的五種PIK3R1核苷酸替換中,一種是膠質(zhì)母細(xì)胞瘤。在我們的TCGA隊(duì)列中,在91例已測(cè)序的膠質(zhì)母細(xì)胞瘤中檢測(cè)到9例PIK3R1體細(xì)胞突變。它們都不在PIK3CA突變的樣本中。在9個(gè)突變中,8個(gè)位于中間的SH2(或iSH2)結(jié)構(gòu)域內(nèi),4個(gè)是3-bp的框內(nèi)缺失(圖3a和補(bǔ)充表6)。根據(jù)PI(3)K的晶體結(jié)構(gòu),將p85a中的D560和N564氨基酸殘基識(shí)別為p110a C2結(jié)構(gòu)域的N345氨基酸殘基的接觸點(diǎn),膠質(zhì)母細(xì)胞瘤中檢測(cè)到的突變聚集在這三個(gè)氨基酸殘基周圍(圖3b)。包括PIK3CA中的N345K突變(此前在結(jié)腸癌和乳腺癌中有報(bào)道)和PIK3R1中的D560Y和N564K突變。除了兩個(gè)關(guān)鍵殘基附近的其他三個(gè)新的缺失(R574del、T576del和W583del),我們還發(fā)現(xiàn)了一個(gè)18 bp的缺失,跨越了PIK3R1(圖3b)中的殘基D560到S565(DKRMNS)。我們推測(cè),由于這些缺失導(dǎo)致的空間限制可能會(huì)阻止p85aN末端SH2(nSH2)結(jié)構(gòu)域與p110a螺旋結(jié)構(gòu)域的抑制性接觸,從而導(dǎo)致組成性PI3K活性。綜上所述,PI3K晶體結(jié)構(gòu)定義的關(guān)鍵殘基周圍突變的聚集模式強(qiáng)烈表明,這些新的PIK3R1點(diǎn)突變和INDEL破壞了重要的C2–iSH2相互作用,減輕了p85a對(duì)p110a的抑制作用。

圖3 | 膠質(zhì)母細(xì)胞瘤中的PIK3R1和PIK3計(jì)數(shù)。a、 TCGA腫瘤中發(fā)現(xiàn)的突變位置顯示在主干上方。ABD,適配器結(jié)合域;RBD,Ras結(jié)合域;C2,膜結(jié)合域;nSH2,N端SH2結(jié)構(gòu)域;iSH2,內(nèi)部SH2結(jié)構(gòu)域;cSH2,C端SH2結(jié)構(gòu)域。b、 在P110A的C2結(jié)構(gòu)域與p85a的iSH2的相互作用界面中發(fā)現(xiàn)三個(gè)突變。p85a的兩個(gè)殘基D560和N564位于p110a和N345的C2殘基的氫鍵距離內(nèi)。
MGMT甲基化和MMR治療的膠質(zhì)母細(xì)胞瘤
相對(duì)于正常大腦DNA,測(cè)定2305個(gè)基因啟動(dòng)子內(nèi)位于CpG島的CpG二核苷酸的癌癥特異性DNA甲基化(補(bǔ)充表7和補(bǔ)充方法)。MGMT(一種從鳥嘌呤殘基中去除烷基的DNA修復(fù)酶)的啟動(dòng)子甲基化狀態(tài),與膠質(zhì)母細(xì)胞瘤對(duì)烷基化劑的敏感性有關(guān)。91例測(cè)序病例中,19個(gè)樣本被發(fā)現(xiàn)含有MGMT啟動(dòng)子甲基化(包括72個(gè)未治療病例中的13個(gè)和19個(gè)治療病例中的6個(gè))。當(dāng)與體細(xì)胞突變數(shù)據(jù)并列時(shí),高突變表型和MGMT甲基化狀態(tài)之間的有趣關(guān)系出現(xiàn)在治療樣本中。具體而言,MGMT甲基化與經(jīng)治療的膠質(zhì)母細(xì)胞瘤核苷酸替換譜的深刻變化相關(guān)(圖4a)。在未進(jìn)行MGMT甲基化的13個(gè)治療樣本中,29%(99分之29)的經(jīng)驗(yàn)證的體細(xì)胞突變發(fā)生在CpG二核苷酸中的G·C到A·T轉(zhuǎn)換(甲基化胞嘧啶自發(fā)脫氨基的特征),所有突變中的23%(99分之23)發(fā)生在非CpG二核苷酸中的G·C到A·T轉(zhuǎn)換。相比之下,在6個(gè)MGMT甲基化處理的樣本中,81%的突變(181個(gè)突變中的146個(gè))是非CpG二核苷酸中的G·C到A·T轉(zhuǎn)換類型,而所有突變中只有4%(181個(gè)突變中的8個(gè))是CpG中的G·C到A·T突變。這種模式與治療導(dǎo)致的烷基化鳥嘌呤殘基修復(fù)失敗是一致的。換句話說,MGMT甲基化將處理樣本的突變譜轉(zhuǎn)移到非CpG位點(diǎn)的G·C到A·T轉(zhuǎn)換優(yōu)勢(shì)。

圖4 | 經(jīng)治療的膠質(zhì)母細(xì)胞瘤的體細(xì)胞突變、MGMT DNA甲基化和MMR基因突變模式。a、 關(guān)鍵樣本組的每個(gè)腫瘤經(jīng)驗(yàn)證的體細(xì)胞核苷酸替換的平均數(shù)量顯示在Y軸上,并用條形直方圖的高度表示。樣本根據(jù)患者的治療狀態(tài)沿X軸分組(減表示未治療;加上表示已處理),MGMT的DNA甲基化狀態(tài)(Meht為DNA甲基化;-為未甲基化),以及MMR基因的遺傳狀態(tài)(-為無基因突變;Mut為一個(gè)或多個(gè)MLH1、MSH2、MSH6或MS2基因突變);每個(gè)欄下方的數(shù)字表示組中的樣本數(shù)。對(duì)核苷酸替換類型進(jìn)行顏色編碼,包括非CpG位點(diǎn)的G-to-A轉(zhuǎn)換(藍(lán)色)、CpG位點(diǎn)的G-to-A轉(zhuǎn)換(綠色)和其他突變類型(灰色)。b、 作為MGMT治療狀態(tài)和甲基化狀態(tài)函數(shù)的MMR基因突變譜條形直方圖。替代類型的顏色代碼與a中相同。
值得注意的是,MMR基因本身的突變譜反映了MGMT甲基化狀態(tài)和治療結(jié)果。在六甲基化、超突變(治療)腫瘤中發(fā)現(xiàn)的所有七種MMR基因突變都是在非CpG位點(diǎn)發(fā)生的G·C到A·T突變(圖4b和補(bǔ)充表6),而非甲基化、超突變腫瘤中的MMR突變均不具有這一特征。因此,這些數(shù)據(jù)表明,MMR缺乏和MGM甲基化在治療過程中共同對(duì)膠質(zhì)母細(xì)胞瘤體細(xì)胞點(diǎn)突變的總體頻率和模式產(chǎn)生強(qiáng)大的影響,這一觀察結(jié)果具有潛在的臨床重要性。
綜合分析確定了膠質(zhì)母細(xì)胞瘤的核心通路
為了開始構(gòu)建膠質(zhì)母細(xì)胞瘤基因組中常見遺傳改變的綜合視圖,我們將明確的遺傳改變——經(jīng)驗(yàn)證的體細(xì)胞核核苷酸替換、純合缺失和局灶性擴(kuò)增——映射到與膠質(zhì)母細(xì)胞瘤相關(guān)的主要途徑1上。該分析確定了一個(gè)高度互聯(lián)的畸變網(wǎng)絡(luò)(補(bǔ)充圖7和8),包括三條主要途徑:RTK信號(hào)傳導(dǎo),以及p53和RB腫瘤抑制途徑(圖5)。
僅通過拷貝數(shù)數(shù)據(jù),206個(gè)樣本中的66%、70%和59%分別在RB、TP53和RTK通路的核心成分中存在體細(xì)胞改變(補(bǔ)充表8)。在有測(cè)序數(shù)據(jù)的91個(gè)樣本中,體細(xì)胞改變的頻率分別增加到87%、78%和88%(補(bǔ)充表9)。有一種統(tǒng)計(jì)趨勢(shì),即每個(gè)通路中的組分變化相互排斥(p53、RB和RTK通路的P值分別為9.33 X 10-10、2.5 X 10-13和0.022;補(bǔ)充表10),這與放松對(duì)通路中一種成分的調(diào)節(jié)可以減輕對(duì)其他成分的選擇壓力的論點(diǎn)相一致。然而,我們觀察到一個(gè)大于隨機(jī)的機(jī)會(huì)(單側(cè),P=0.0018)一個(gè)給定的樣本至少含有一個(gè)來自三條途徑的異?;颍ㄑa(bǔ)充表10)。事實(shí)上,74%的患者在所有三條通路中都存在異常,這一模式表明,解除三條通路的調(diào)節(jié)是膠質(zhì)母細(xì)胞瘤發(fā)病機(jī)制的核心要求。
除了脂類磷酸酶腫瘤抑制基因的頻繁缺失和突變外,86%的膠質(zhì)母細(xì)胞瘤樣本在核心RTK/PI3K通路中至少存在一個(gè)遺傳事件(圖5a)。除GFR和ERBB2外,PDGFRA(13%)和MET(4%)表現(xiàn)出頻繁的畸變(補(bǔ)充表9)。在91個(gè)測(cè)序樣本中,共有10個(gè)樣本在4個(gè)分類的RTK中至少有2個(gè)存在擴(kuò)增或點(diǎn)突變(EGFR、ERBB2、PDGFRA和MET;補(bǔ)充表9),表明基因組激活可能是共激活RTK的一種機(jī)制。

圖5 | 三條關(guān)鍵信號(hào)通路中的頻繁基因改變。圖中顯示了RTK/RAS/PI3K(a)、p53(b)和RB(c)信號(hào)通路組成部分的一級(jí)序列改變和顯著拷貝數(shù)改變。紅色表示激活基因改變,頻繁改變的基因顯示更深的紅色。相反,藍(lán)色表示失活性改變,較深的陰影對(duì)應(yīng)較高的改變百分比。對(duì)于特定通路的每一個(gè)改變成分,改變的性質(zhì)和受影響腫瘤的百分比都會(huì)被指出??蛑邪z質(zhì)母細(xì)胞瘤的最終百分比,其中至少有一個(gè)指定通路的已知組分基因發(fā)生了改變。
除了p53本身的突變外,p53途徑的失活表現(xiàn)為ARF缺失(55%)、DM2擴(kuò)增(11%)和MDM4擴(kuò)增(4%)(圖5b和補(bǔ)充表8)。在91個(gè)測(cè)序樣本中(補(bǔ)充表9),基因損傷INTP53與MDM2或MDM4相互排斥(兩者的優(yōu)勢(shì)比均為0.00;P50。分別為0.02和0.068;補(bǔ)充表10),但不是inARF的補(bǔ)充表。事實(shí)上,32例TP53突變的腫瘤中有10例也有deletedARF,這表明CDKN2A基因座(編碼p16INK4A和ARF)的純合缺失至少部分由p16INK4A驅(qū)動(dòng)。
在77%存在RB通路畸變的樣本中(圖5c),最常見的事件是染色體9p21上的CDKN2A/CDKN2B基因座缺失(55%和53%),隨后是CDK4位點(diǎn)擴(kuò)增(14%)(圖5c和補(bǔ)充表8和9)。盡管CDK/RB通路成員中的CNA可能在同一腫瘤中同時(shí)發(fā)生14,但所有9個(gè)帶有RB1核苷酸替換的樣本(補(bǔ)充表9)都缺乏CDDKN2A/CDKN2B缺失或通路中的其他CNA,這表明與拷貝數(shù)丟失相比,通過核苷酸替換使RB1失活可以避免遺傳性的基因突變。
討論
在建立這一試點(diǎn)方案的過程中,TCGA制定了生物樣本銀行和收集方面的重要原則,并建立了未來將服務(wù)于類似工作的基礎(chǔ)設(shè)施。雖然它確保了高質(zhì)量的數(shù)據(jù),但嚴(yán)格的生物樣本選擇標(biāo)準(zhǔn)可能引入了一定程度的偏差,因?yàn)榕懦诵颖竞透咚綁乃赖臉颖尽1M管如此,該隊(duì)列的臨床參數(shù)與其他已發(fā)表隊(duì)列相似(補(bǔ)充圖3和補(bǔ)充表1)。
來自互補(bǔ)技術(shù)平臺(tái)的多維基因組數(shù)據(jù)的綜合分析被證明是信息豐富的。除了將RB、p53和RTK/RAS/PI3K通路的去調(diào)節(jié)作為大多數(shù)(也許是所有)膠質(zhì)母細(xì)胞瘤腫瘤的強(qiáng)制性事件外,突變模式也可能為未來的治療決策提供信息。有理由推測(cè),DKN2AO缺失或失活突變的患者或CDKN2Cor擴(kuò)增CDK4/CDK6的患者可能是CDK抑制劑治療的候選者,這一策略不太可能對(duì)RB1突變的患者有效。類似地,具有PTEN缺失或PIK3CA或PIK3R1激活突變的患者可能會(huì)從PI3K或PDK1抑制劑中獲益,而PI3K通路被AKT3擴(kuò)增改變的腫瘤可能證明對(duì)這些方式不起作用?;蚪M共擴(kuò)增的存在加強(qiáng)了最近關(guān)于單個(gè)膠質(zhì)母細(xì)胞瘤標(biāo)本中多個(gè)磷酸化(激活)RTK的報(bào)道,這表明了一種根據(jù)RTK突變的特定模式定制抗RTK治療雞尾酒的方法。此外,聯(lián)合抗RTK治療可能與下游抑制PI3K或細(xì)胞周期介質(zhì)協(xié)同作用。相比之下,NF1突變的膠質(zhì)母細(xì)胞瘤可能受益于RAF或MEK抑制劑作為組合的一部分,如BRAF突變癌所示。
膠質(zhì)母細(xì)胞瘤最重要的生物標(biāo)志物之一是GMT的甲基化狀態(tài),它預(yù)測(cè)對(duì)替莫唑胺的敏感性,替莫唑胺是膠質(zhì)母細(xì)胞瘤患者目前的護(hù)理標(biāo)準(zhǔn)。對(duì)突變、DNA甲基化和臨床(治療)數(shù)據(jù)的綜合分析(盡管樣本數(shù)量較少)表明,一系列相互關(guān)聯(lián)的事件可能會(huì)影響臨床反應(yīng)和結(jié)果。新診斷的MGM甲基化膠質(zhì)母細(xì)胞瘤對(duì)烷基化劑治療反應(yīng)良好,部分原因是未修復(fù)的烷基化鳥嘌呤殘基啟動(dòng)了無效的錯(cuò)配修復(fù)周期,可導(dǎo)致細(xì)胞死亡。因此,用烷基化療法治療GMT缺乏的膠質(zhì)母細(xì)胞瘤會(huì)產(chǎn)生強(qiáng)烈的選擇性壓力,從而失去錯(cuò)配修復(fù)功能。這一結(jié)論與我們的觀察結(jié)果一致,即錯(cuò)配修復(fù)基因本身在非CpG位點(diǎn)發(fā)生了特征性C·G到A·T的轉(zhuǎn)換,這是由未修復(fù)的烷基化鳥嘌呤殘基引起的。所以,GMT的初始甲基化,結(jié)合治療,可能會(huì)導(dǎo)致影響錯(cuò)配修復(fù)基因突變的突變譜的改變和失去錯(cuò)配修復(fù)功能的選擇性壓力。換句話說,我們的發(fā)現(xiàn)增加了這樣一種可能性,即最初對(duì)目前使用的一線治療有反應(yīng)的患者不僅可能產(chǎn)生治療耐藥性,而且可能出現(xiàn)MMR缺陷型高突變表型。如果這一假設(shè)得到驗(yàn)證,人們可能會(huì)推測(cè),針對(duì)失配修復(fù)缺陷細(xì)胞設(shè)計(jì)的選擇性策略將代表與烷基化劑的合理前期組合,共同防止或最小化這種耐藥性的出現(xiàn)。相反,這種治療介導(dǎo)的突變表型可增強(qiáng)對(duì)靶向治療產(chǎn)生耐藥性的途徑突變,從而警告烷基化劑與靶向劑的組合,因?yàn)檫@可能顯著增加對(duì)此類靶向藥物產(chǎn)生耐藥性的可能性。
TCGA利用統(tǒng)計(jì)上穩(wěn)健的樣本數(shù)量產(chǎn)生前所未有的多維數(shù)據(jù)集的能力為發(fā)現(xiàn)新的癌癥干預(yù)措施開辟了一個(gè)新時(shí)代。導(dǎo)致對(duì)潛在耐藥機(jī)制形成意料之外的假設(shè)的綜合分析準(zhǔn)確地強(qiáng)調(diào)了此類項(xiàng)目設(shè)計(jì)的價(jià)值和力量,證明了對(duì)大樣本隊(duì)列進(jìn)行無偏見和系統(tǒng)的癌癥基因組分析是如何導(dǎo)致重大發(fā)現(xiàn)的。
方法概要
根據(jù)適當(dāng)?shù)臋C(jī)構(gòu)審查委員會(huì)對(duì)新診斷的膠質(zhì)母細(xì)胞瘤(腫瘤細(xì)胞百分比最低為80%)的批準(zhǔn),從組織來源地的回顧性數(shù)據(jù)庫中篩選生物樣本。從合格標(biāo)本中提取的RNA和DNA被分發(fā)到TCGA中心進(jìn)行分析。用Sanger法對(duì)腫瘤和正常樣本的全基因組擴(kuò)增基因組DNA樣本進(jìn)行測(cè)序。在校正核苷酸類型的背景突變率和每個(gè)基因的序列覆蓋率后,調(diào)用突變,使用第二個(gè)基因分型平臺(tái)進(jìn)行驗(yàn)證,并進(jìn)行系統(tǒng)分析,以識(shí)別顯著突變的基因。使用安捷倫244K,Affymetrix SNP6進(jìn)行DNA拷貝數(shù)分析。0和Illumina 550K DNA拷貝數(shù)平臺(tái)。使用各種算法(GISTIC、GTS、RAE)確定樣本特異性和重復(fù)性拷貝數(shù)變化。使用Affymetrix U133A、Affymetrix外顯子1.0 ST、定制Agilent 244K和Agilent miRNA陣列平臺(tái)生成信使RNA和microRNA(miRNA)表達(dá)譜。mRNA表達(dá)譜被整合到每個(gè)樣本中每個(gè)基因相對(duì)基因表達(dá)的單個(gè)估計(jì)中。使用Illumina GoldenGate分析測(cè)定CpG二核苷酸的甲基化。DNA序列改變、拷貝數(shù)、mRNA表達(dá)、miRNA表達(dá)和CpG甲基化的所有數(shù)據(jù)均以標(biāo)準(zhǔn)通用格式保存在http://cancergenome.nih.gov/dataportal/。提交給DCC的所有檔案均經(jīng)過驗(yàn)證,以確保文件結(jié)構(gòu)通用,并確保識(shí)別信息的正確使用。