生信小課堂

影響因子:8.8
研究概述:膀胱癌是最常見(jiàn)的尿路上皮癌,其中肌層浸潤(rùn)性膀胱癌(MIBC)往往進(jìn)展迅速并發(fā)生轉(zhuǎn)移,死亡率高。雖然免疫療法在肌層浸潤(rùn)性尿路上皮癌(MUC)的治療中已經(jīng)取得重大進(jìn)展,但仍有相當(dāng)一部分患者未能從中獲益,這可能是由于MUC患者具有明顯的異質(zhì)性,而分子亞型可能有助于解決這一問(wèn)題,因此亟待利用大規(guī)模多組學(xué)數(shù)據(jù)和先進(jìn)的機(jī)器學(xué)習(xí)算法來(lái)確定生物標(biāo)志物以為MUC患者進(jìn)行有效的療效預(yù)測(cè)。在這項(xiàng)研究中,作者結(jié)合了mRNA,lncRNA, miRNA,基因組突變和甲基化組數(shù)據(jù),利用10種多組學(xué)分型的算法構(gòu)建了MUC的分子亞型。隨后,作者根據(jù)不同亞型的差異表達(dá)確定了32個(gè)穩(wěn)定的預(yù)后相關(guān)基因(SPRGs),并采用10種機(jī)器學(xué)習(xí)算法共99種算法組合構(gòu)建了機(jī)器學(xué)習(xí)驅(qū)動(dòng)特征(CMLS)。在訓(xùn)練和驗(yàn)證隊(duì)列中,CMLS顯示出顯著的預(yù)后價(jià)值,同時(shí)在預(yù)測(cè)對(duì)免疫療法和藥物療法的反應(yīng)方面表現(xiàn)出強(qiáng)大的性能。該研究為完善 MUC 分子亞型、加強(qiáng)這種惡性腫瘤的精準(zhǔn)分層和個(gè)體化治療方法提供了一個(gè)重要的參考。
機(jī)器學(xué)習(xí)目前在腫瘤和非腫瘤生信中越來(lái)越常見(jiàn),不管是構(gòu)建模型還是篩選關(guān)鍵基因,都有很出色的發(fā)揮。想做類似分析的朋友,歡迎交流!
研究結(jié)果:
流程圖
選出mRNA, lncRNA, miRNA, 基因組突變以及甲基化組中變異程度最大的1500個(gè)基因,隨后使用單因素cox回歸篩選出預(yù)后相關(guān)基因作為候選基因(突變信息根據(jù)突變頻率篩選)。接下來(lái)使用10種多組學(xué)聚類方法將MUC患者分為3個(gè)亞型,然后進(jìn)一步使用基于10種機(jī)器學(xué)習(xí)算法的99種算法組合選出最能準(zhǔn)確預(yù)測(cè)免疫治療隊(duì)列患者生存的CoxBoost+Stepwise Cox組合,使用該組合構(gòu)建CMLS,從而全面評(píng)估其與預(yù)后,免疫治療反應(yīng),腫瘤免疫微環(huán)境以及藥物治療反應(yīng)之間的關(guān)系。

基于多組學(xué)和機(jī)器學(xué)習(xí)的MUC 預(yù)后相關(guān)分子亞型
分型是基于TCGA-BLCA的多組學(xué)數(shù)據(jù),使用MOVICS包進(jìn)行多組學(xué)多算法多分型的整合。首先使用包中的getElites函數(shù)篩選出各組學(xué)中變化最大的前1500個(gè)基因(或突變頻率最高的1500個(gè)基因),再以此作為輸入,使用包中g(shù)etMOIC函數(shù)中流程化的10種聚類算法: iClusterBayes, moCluster, CIMLR, IntNMF, ConsensusClustering, COCA, NEMO, PINSPlus, SNF和LRA,根據(jù)先前的研究指定將患者分為三型,獲得每種算法的分型結(jié)果后,使用getConsensusMOIC函數(shù)整合10種分型的結(jié)果并最終生成一種穩(wěn)健的分型(以下稱為CSs)。圖A是整合分型在多組學(xué)中的分型效果,圖B展示了CSs以及10種分型的結(jié)果,圖C的相關(guān)性熱圖也展示了各亞型內(nèi)的相似性以及亞型間的不相關(guān)性,圖D的KM曲線說(shuō)明基于多組學(xué)和多模型構(gòu)建的分型能夠準(zhǔn)確對(duì)患者預(yù)后進(jìn)行分層。

各亞型的分子景觀
圖A是作者收集的與治療反應(yīng)相關(guān)以及膀胱癌相關(guān)的signature的GSVA得分在亞型之間的差異,表明CS2可能更傾向于目前公認(rèn)的管腔樣亞型,而CS3可能更傾向于基底樣亞型。圖B分析了與癌癥染色質(zhì)重塑相關(guān)的潛在調(diào)節(jié)因子和23個(gè)轉(zhuǎn)錄因子在3個(gè)亞型間的差異,證實(shí)了CSs的生物學(xué)相關(guān)性。圖C頂部注釋顯示了腫瘤浸潤(rùn)淋巴細(xì)胞的免疫富集得分、基質(zhì)富集得分和 DNA 甲基化,熱圖上圖顯示了典型免疫檢查點(diǎn)基因的表達(dá),下圖顯示了 24 種 TME 相關(guān)免疫細(xì)胞的富集水平。接下來(lái),作者對(duì)META-MUC(8個(gè)尿路上皮癌轉(zhuǎn)錄組數(shù)據(jù)去批次后整合成的一個(gè)meta隊(duì)列)三個(gè)亞型之間進(jìn)行了差異分析,選擇了 20 個(gè)對(duì)每個(gè)亞型特異性上調(diào)的基因作為分類器,圖D是三個(gè)亞型的TOP20基因表達(dá)熱圖(圖D),圖E的KM曲線驗(yàn)證了META-MUC中分型的生存預(yù)測(cè)能力,圖F-I比較了CSs和NTP以及PAM分類器的一致性。

構(gòu)建CMLS
圖A是基于10種機(jī)器學(xué)習(xí)組合的99種算法對(duì)TCGA-MUC, IMvigor-MUC和META-MUC三個(gè)隊(duì)列的生存進(jìn)行了預(yù)測(cè),比較用于量化預(yù)測(cè)性能的C-index發(fā)現(xiàn)CoxBoost + Stepwise Cox的預(yù)測(cè)性能最好,其中CoxBoost用于對(duì)預(yù)后基因進(jìn)行進(jìn)一步篩選,最終獲得12個(gè)hub基因(圖B),圖C是這12個(gè)hub基因在三個(gè)隊(duì)列中的單因素cox回歸結(jié)果,隨后基于最佳算法構(gòu)建了CMLS,圖D-G通過(guò)KM曲線證明了CMLS對(duì)生存的預(yù)測(cè)能力。

比較CMLS與其他signature
作者收集了22個(gè)已出版的signature,在TCGA-MUC, META-MUC, IMvigor-MUC隊(duì)列中比較其與CMLS對(duì)預(yù)后的預(yù)測(cè)效能,發(fā)現(xiàn)CMLS在META-MUC和IMvigor-MUC隊(duì)列中預(yù)測(cè)效能最高(圖A-C)。為了增強(qiáng)實(shí)用性,作者基于CMLS構(gòu)建了諾莫圖并將其做成交互界面(圖D)。校準(zhǔn)曲線證明(圖E),列線圖的精度與實(shí)際情況相一致。決策曲線分析(DCA)顯示,列線圖對(duì)患者的臨床獲益明顯高于單獨(dú)使用CMLS(圖F, G),且時(shí)間依賴的c指數(shù)進(jìn)一步證明了列線圖具有更好的預(yù)測(cè)性能(圖H)


與 CMLS 有關(guān)的免疫特征
這部分作者使用IOBR包對(duì)MUC的TME進(jìn)行了全面分析,觀察到低CMLS患者的免疫細(xì)胞浸潤(rùn)水平(包括T細(xì)胞、B細(xì)胞和巨噬細(xì)胞)明顯高于高CMLS患者,表明存在免疫激活狀態(tài)(圖A)。圖B和C說(shuō)明與免疫抑制和排斥相關(guān)的分子標(biāo)記物也主要在高CMLS組中富集,顯示出免疫抑制狀態(tài),之前報(bào)道的與更好的免疫治療相關(guān)的特征也在低CMLS組中顯著富集(圖6D),這些發(fā)現(xiàn)都傾向于將高CMLS組歸為“冷腫瘤”,將低CMLS組歸為“熱腫瘤”。圖E-H說(shuō)明腫瘤突變負(fù)荷TMB,及腫瘤新抗原負(fù)荷TNB以及M1浸潤(rùn)在低CMLS組中均更高,圖G-H分別以這三個(gè)因素為分組變量,結(jié)合CMLS分組進(jìn)行生存分析并繪制KM曲線,發(fā)現(xiàn)CMLS越低,TMB, TNM以及M1巨噬細(xì)胞浸潤(rùn)越高,MUC患者生存越好。

CMLS 對(duì)免疫療法反應(yīng)具有出色的預(yù)測(cè)能力
作者首先對(duì)IMvigor-MUC 隊(duì)列進(jìn)行了詳細(xì)分析,因?yàn)樵撽?duì)列擁有全面的預(yù)后和治療相關(guān)信息??紤]到免疫治療延遲起效,作者評(píng)估了治療 3 個(gè)月后患者的長(zhǎng)期生存期差異,發(fā)現(xiàn)低分組顯示出更好的預(yù)后效果(圖A,B),圖C柱狀圖表明在有反應(yīng)組的CMLS得分低于無(wú)反應(yīng)組。圖D是基于TIP算法評(píng)估的抗腫瘤免疫7步驟活性在兩組間的差異,發(fā)現(xiàn)第4/5/7步差異顯著,這與上述結(jié)果一致。接下來(lái),作者使用TIDE算法預(yù)測(cè)了免疫治療反應(yīng)(圖E),柱狀圖展示了高低CMLS組間有反應(yīng)和無(wú)反應(yīng)患者的比例,圖F是基于submap算法評(píng)估CMLS分組與抗PD1以及CTLA4療效反應(yīng)分組的一致性,這些分析均發(fā)現(xiàn)低CMLS患者對(duì)免疫治療反應(yīng)更好。圖G-I是CMLS在另外三個(gè)免疫治療隊(duì)列中預(yù)測(cè)預(yù)后效能的評(píng)估,同樣發(fā)現(xiàn)低CMLS的療效可能更好。


篩選潛在的治療藥物
圖A的GSEA富集分析發(fā)現(xiàn)高CMLS組患者的血管生成、EMT、缺氧等通路被明顯激活,從前的研究指出ERCC1是接受順鉑化療晚期膀胱癌患者的預(yù)后標(biāo)志物,圖B表明ERCC1表達(dá)水平低的患者對(duì)順鉑治療的反應(yīng)更強(qiáng),這說(shuō)明這部分的敏感藥物篩選是合理的。圖C是為免疫治療不敏感的高CMLS組患者篩選潛在藥物的流程圖,基于CTRP和PRISM藥敏數(shù)據(jù)以及細(xì)胞系表達(dá)矩陣,將細(xì)胞系分為高低CMLS兩組,兩組間進(jìn)行秩和檢驗(yàn)得到高CMLS敏感性高的藥物,同時(shí)對(duì)藥物反應(yīng)和CMLS得分進(jìn)行spearman相關(guān)性分析獲得敏感性與CMLS正相關(guān)的藥物,兩者取交集得到候選藥物。圖D和E分別是基于CTRP和PRISM數(shù)據(jù)庫(kù)篩選出的潛在藥物,圖F和G是這些藥物作用靶點(diǎn)在正常與腫瘤之間的差異表達(dá),最終鑒定出達(dá)沙替尼和羅米地辛是治療高CMLS患者的潛在藥物。

研究總結(jié): 本研究通過(guò)多組學(xué)共識(shí)聚類確定了MUC的三種分子亞型,揭示了它們?cè)陬A(yù)后方面的顯著差異,并有可能細(xì)化MUC的分子分型。利用機(jī)器學(xué)習(xí)算法框架構(gòu)建了CMLS,它在多個(gè)隊(duì)列中表現(xiàn)出優(yōu)越的性能,可以穩(wěn)健地預(yù)測(cè)患者預(yù)后,同時(shí)顯示出與免疫治療反應(yīng)密切相關(guān)??紤]到在高CMLS組中觀察到的不良預(yù)后和低免疫治療反應(yīng),作者進(jìn)一步進(jìn)行了藥物敏感性分析,篩選出達(dá)沙替尼和羅米地辛兩種潛在藥物。本研究通過(guò)將多組學(xué)數(shù)據(jù)和大量機(jī)器學(xué)習(xí)算法相結(jié)合,為MUC患者的早期診斷和精確治療提供了基礎(chǔ)。