
影響因子:8.8
研究概述:膀胱癌是最常見的尿路上皮癌,其中肌層浸潤性膀胱癌(MIBC)往往進展迅速并發(fā)生轉(zhuǎn)移,死亡率高。雖然免疫療法在肌層浸潤性尿路上皮癌(MUC)的治療中已經(jīng)取得重大進展,但仍有相當一部分患者未能從中獲益,這可能是由于MUC患者具有明顯的異質(zhì)性,而分子亞型可能有助于解決這一問題,因此亟待利用大規(guī)模多組學數(shù)據(jù)和先進的機器學習算法來確定生物標志物以為MUC患者進行有效的療效預(yù)測。在這項研究中,作者結(jié)合了mRNA,lncRNA, miRNA,基因組突變和甲基化組數(shù)據(jù),利用10種多組學分型的算法構(gòu)建了MUC的分子亞型。隨后,作者根據(jù)不同亞型的差異表達確定了32個穩(wěn)定的預(yù)后相關(guān)基因(SPRGs),并采用10種機器學習算法共99種算法組合構(gòu)建了機器學習驅(qū)動特征(CMLS)。在訓(xùn)練和驗證隊列中,CMLS顯示出顯著的預(yù)后價值,同時在預(yù)測對免疫療法和藥物療法的反應(yīng)方面表現(xiàn)出強大的性能。該研究為完善 MUC 分子亞型、加強這種惡性腫瘤的精準分層和個體化治療方法提供了一個重要的參考。
機器學習目前在腫瘤和非腫瘤生信中越來越常見,不管是構(gòu)建模型還是篩選關(guān)鍵基因,都有很出色的發(fā)揮!
研究結(jié)果:
流程圖
選出mRNA, lncRNA, miRNA, 基因組突變以及甲基化組中變異程度最大的1500個基因,隨后使用單因素cox回歸篩選出預(yù)后相關(guān)基因作為候選基因(突變信息根據(jù)突變頻率篩選)。接下來使用10種多組學聚類方法將MUC患者分為3個亞型,然后進一步使用基于10種機器學習算法的99種算法組合選出最能準確預(yù)測免疫治療隊列患者生存的CoxBoost+Stepwise Cox組合,使用該組合構(gòu)建CMLS,從而全面評估其與預(yù)后,免疫治療反應(yīng),腫瘤免疫微環(huán)境以及藥物治療反應(yīng)之間的關(guān)系。

基于多組學和機器學習的MUC 預(yù)后相關(guān)分子亞型
分型是基于TCGA-BLCA的多組學數(shù)據(jù),使用MOVICS包進行多組學多算法多分型的整合。首先使用包中的getElites函數(shù)篩選出各組學中變化最大的前1500個基因(或突變頻率最高的1500個基因),再以此作為輸入,使用包中g(shù)etMOIC函數(shù)中流程化的10種聚類算法: iClusterBayes, moCluster, CIMLR, IntNMF, ConsensusClustering, COCA, NEMO, PINSPlus, SNF和LRA,根據(jù)先前的研究指定將患者分為三型,獲得每種算法的分型結(jié)果后,使用getConsensusMOIC函數(shù)整合10種分型的結(jié)果并最終生成一種穩(wěn)健的分型(以下稱為CSs)。圖A是整合分型在多組學中的分型效果,圖B展示了CSs以及10種分型的結(jié)果,圖C的相關(guān)性熱圖也展示了各亞型內(nèi)的相似性以及亞型間的不相關(guān)性,圖D的KM曲線說明基于多組學和多模型構(gòu)建的分型能夠準確對患者預(yù)后進行分層。

各亞型的分子景觀
圖A是作者收集的與治療反應(yīng)相關(guān)以及膀胱癌相關(guān)的signature的GSVA得分在亞型之間的差異,表明CS2可能更傾向于目前公認的管腔樣亞型,而CS3可能更傾向于基底樣亞型。圖B分析了與癌癥染色質(zhì)重塑相關(guān)的潛在調(diào)節(jié)因子和23個轉(zhuǎn)錄因子在3個亞型間的差異,證實了CSs的生物學相關(guān)性。圖C頂部注釋顯示了腫瘤浸潤淋巴細胞的免疫富集得分、基質(zhì)富集得分和 DNA 甲基化,熱圖上圖顯示了典型免疫檢查點基因的表達,下圖顯示了 24 種 TME 相關(guān)免疫細胞的富集水平。接下來,作者對META-MUC(8個尿路上皮癌轉(zhuǎn)錄組數(shù)據(jù)去批次后整合成的一個meta隊列)三個亞型之間進行了差異分析,選擇了 20 個對每個亞型特異性上調(diào)的基因作為分類器,圖D是三個亞型的TOP20基因表達熱圖(圖D),圖E的KM曲線驗證了META-MUC中分型的生存預(yù)測能力,圖F-I比較了CSs和NTP以及PAM分類器的一致性。

構(gòu)建CMLS
圖A是基于10種機器學習組合的99種算法對TCGA-MUC, IMvigor-MUC和META-MUC三個隊列的生存進行了預(yù)測,比較用于量化預(yù)測性能的C-index發(fā)現(xiàn)CoxBoost + Stepwise Cox的預(yù)測性能最好,其中CoxBoost用于對預(yù)后基因進行進一步篩選,最終獲得12個hub基因(圖B),圖C是這12個hub基因在三個隊列中的單因素cox回歸結(jié)果,隨后基于最佳算法構(gòu)建了CMLS,圖D-G通過KM曲線證明了CMLS對生存的預(yù)測能力。

比較CMLS與其他signature
作者收集了22個已出版的signature,在TCGA-MUC, META-MUC, IMvigor-MUC隊列中比較其與CMLS對預(yù)后的預(yù)測效能,發(fā)現(xiàn)CMLS在META-MUC和IMvigor-MUC隊列中預(yù)測效能最高(圖A-C)。為了增強實用性,作者基于CMLS構(gòu)建了諾莫圖并將其做成交互界面(圖D)。校準曲線證明(圖E),列線圖的精度與實際情況相一致。決策曲線分析(DCA)顯示,列線圖對患者的臨床獲益明顯高于單獨使用CMLS(圖F, G),且時間依賴的c指數(shù)進一步證明了列線

與 CMLS 有關(guān)的免疫特征
這部分作者使用IOBR包對MUC的TME進行了全面分析,觀察到低CMLS患者的免疫細胞浸潤水平(包括T細胞、B細胞和巨噬細胞)明顯高于高CMLS患者,表明存在免疫激活狀態(tài)(圖A)。圖B和C說明與免疫抑制和排斥相關(guān)的分子標記物也主要在高CMLS組中富集,顯示出免疫抑制狀態(tài),之前報道的與更好的免疫治療相關(guān)的特征也在低CMLS組中顯著富集(圖6D),這些發(fā)現(xiàn)都傾向于將高CMLS組歸為“冷腫瘤”,將低CMLS組歸為“熱腫瘤”。圖E-H說明腫瘤突變負荷TMB,及腫瘤新抗原負荷TNB以及M1浸潤在低CMLS組中均更高,圖G-H分別以這三個因素為分組變量,結(jié)合CMLS分組進行生存分析并繪制KM曲線,發(fā)現(xiàn)CMLS越低,TMB, TNM以及M1巨噬細胞浸潤越高,MUC患者生存越好。

CMLS 對免疫療法反應(yīng)具有出色的預(yù)測能力
作者首先對IMvigor-MUC 隊列進行了詳細分析,因為該隊列擁有全面的預(yù)后和治療相關(guān)信息??紤]到免疫治療延遲起效,作者評估了治療 3 個月后患者的長期生存期差異,發(fā)現(xiàn)低分組顯示出更好的預(yù)后效果(圖A,B),圖C柱狀圖表明在有反應(yīng)組的CMLS得分低于無反應(yīng)組。圖D是基于TIP算法評估的抗腫瘤免疫7步驟活性在兩組間的差異,發(fā)現(xiàn)第4/5/7步差異顯著,這與上述結(jié)果一致。接下來,作者使用TIDE算法預(yù)測了免疫治療反應(yīng)(圖E),柱狀圖展示了高低CMLS組間有反應(yīng)和無反應(yīng)患者的比例,圖F是基于submap算法評估CMLS分組與抗PD1以及CTLA4療效反應(yīng)分組的一致性,這些分析均發(fā)現(xiàn)低CMLS患者對免疫治療反應(yīng)更好。圖G-I是CMLS在另外三個免疫治療隊列中預(yù)測預(yù)后效能的評估,同樣發(fā)現(xiàn)低CMLS的療效可能更好。


篩選潛在的治療藥物
圖A的GSEA富集分析發(fā)現(xiàn)高CMLS組患者的血管生成、EMT、缺氧等通路被明顯激活,從前的研究指出ERCC1是接受順鉑化療晚期膀胱癌患者的預(yù)后標志物,圖B表明ERCC1表達水平低的患者對順鉑治療的反應(yīng)更強,這說明這部分的敏感藥物篩選是合理的。圖C是為免疫治療不敏感的高CMLS組患者篩選潛在藥物的流程圖,基于CTRP和PRISM藥敏數(shù)據(jù)以及細胞系表達矩陣,將細胞系分為高低CMLS兩組,兩組間進行秩和檢驗得到高CMLS敏感性高的藥物,同時對藥物反應(yīng)和CMLS得分進行spearman相關(guān)性分析獲得敏感性與CMLS正相關(guān)的藥物,兩者取交集得到候選藥物。圖D和E分別是基于CTRP和PRISM數(shù)據(jù)庫篩選出的潛在藥物,圖F和G是這些藥物作用靶點在正常與腫瘤之間的差異表達,最終鑒定出達沙替尼和羅米地辛是治療高CMLS患者的潛在藥物。

研究總結(jié):
本研究通過多組學共識聚類確定了MUC的三種分子亞型,揭示了它們在預(yù)后方面的顯著差異,并有可能細化MUC的分子分型。利用機器學習算法框架構(gòu)建了CMLS,它在多個隊列中表現(xiàn)出優(yōu)越的性能,可以穩(wěn)健地預(yù)測患者預(yù)后,同時顯示出與免疫治療反應(yīng)密切相關(guān)。考慮到在高CMLS組中觀察到的不良預(yù)后和低免疫治療反應(yīng),作者進一步進行了藥物敏感性分析,篩選出達沙替尼和羅米地辛兩種潛在藥物。本研究通過將多組學數(shù)據(jù)和大量機器學習算法相結(jié)合,為MUC患者的早期診斷和精確治療提供了基礎(chǔ)。