一、文章信息
發(fā)表雜志名稱:Journal of Translational Medicine
中文標題:機器學習結(jié)合單細胞和空間轉(zhuǎn)錄組學揭示膠質(zhì)母細胞瘤中基底膜相關(guān)基因特征
英文標題:Machine learning-enhanced discovery of a basement membrane-related gene signature in glioblastoma via single-cell and Spatial transcriptomics
影響因子:7.5
發(fā)表日期:2025年11月20日
二、研究概述
膠質(zhì)母細胞瘤(GBM)具有復(fù)雜的侵襲性和異質(zhì)性,嚴重阻礙腫瘤的徹底根除,而基底膜(BM)侵襲是膠質(zhì)瘤細胞擴散和轉(zhuǎn)移的前提,顯著影響患者預(yù)后。本研究整合4個GBM患者隊列,通過二元分類機器學習篩選基底膜相關(guān)候選基因,構(gòu)建了包含4個核心基因(FOS、ADM、PLOD3、AEBP1)的BMRGs風險模型。該模型能有效區(qū)分高、低風險患者,且高風險組與M2樣巨噬細胞浸潤增加、CD8+T細胞減少相關(guān),對免疫治療敏感性降低但對部分化療藥物更敏感。結(jié)合單細胞和空間轉(zhuǎn)錄組學發(fā)現(xiàn),高BMRGs表達的腫瘤細胞具有更強的細胞間通訊功能,且FOS可調(diào)控其他三個基因的表達。研究通過獨立隊列驗證,為GBM的預(yù)后評估和個性化治療提供了新的分子靶點和策略。
三、論文核心解讀
(一)研究目標與解決的實際問題
核心目標:明確基底膜(BM)相關(guān)基因(BMRGs)與膠質(zhì)母細胞瘤(GBM)的分子關(guān)聯(lián),構(gòu)建可靠的BMRGs風險模型,揭示其在GBM預(yù)后、免疫微環(huán)境及治療響應(yīng)中的作用。
解決的實際問題:
現(xiàn)有GBM預(yù)后模型準確性不足、實用性有限,缺乏基于BM相關(guān)機制的特異性預(yù)測工具;
GBM侵襲性和異質(zhì)性導(dǎo)致治療效果差、復(fù)發(fā)率高,需明確BM相關(guān)分子機制以開發(fā)針對性治療策略;
免疫治療在GBM中的響應(yīng)差異較大,需找到能預(yù)測免疫治療敏感性的生物標志物。
(二)研究方法與目的(表格匯總)
表1 數(shù)據(jù)收集與預(yù)處理方法
| 方法類型 | 具體方法 | 核心目的 |
|---|---|---|
| 數(shù)據(jù)來源 | 整合GEO、EGA、TCGA、GTEx等數(shù)據(jù)庫的4個GBM隊列(614例GBM+44例正常組織) | 獲取大樣本量、多平臺數(shù)據(jù),確保結(jié)果通用性 |
| 批次效應(yīng)處理 | sva R包的ComBat函數(shù) | 消除不同隊列間的技術(shù)差異,保證數(shù)據(jù)可比性 |
| 候選基因篩選 | 結(jié)合手動整理的222個BMRGs和Genecard數(shù)據(jù)庫2466個相關(guān)基因,共2518個候選基因 | 全面覆蓋BM相關(guān)基因,避免遺漏關(guān)鍵靶點 |
表2 生信分析方法
| 分析類型 | 具體方法 | 核心目的 |
|---|---|---|
| 差異基因分析 | limma R包(adj.P.Val<0.05 & log2FC>1) | 篩選GBM與正常組織間差異表達的BMRGs |
| 機器學習篩選 | 14種二元分類算法(NN、Lasso、SVM等) | 篩選出在10種以上最優(yōu)模型中出現(xiàn)的核心BMRGs |
| 風險模型構(gòu)建 | 單變量Cox回歸+10種ML算法組合(RSF、Lasso等) | 構(gòu)建高準確性、穩(wěn)定的BMRGs預(yù)后模型 |
| 免疫分析 | CIBERSORT、xCell、ssGSEA算法 | 比較高/低風險組的免疫細胞浸潤差異 |
| 治療響應(yīng)預(yù)測 | TIDE、IRnet算法(免疫治療);OncoPredict(化療藥物敏感性) | 預(yù)測不同風險組的治療響應(yīng)差異 |
表3 單細胞與空間轉(zhuǎn)錄組分析方法
| 分析類型 | 具體方法 | 核心目的 |
|---|---|---|
| 單細胞數(shù)據(jù)處理 | Seurat包質(zhì)控、Harmony算法批次校正 | 獲得高質(zhì)量、無批次效應(yīng)的單細胞數(shù)據(jù)集 |
| 細胞通訊分析 | CellChat R包 | 分析高/低BMRGs表達腫瘤細胞的細胞間通訊差異 |
| 基因調(diào)控網(wǎng)絡(luò) | SCENIC算法(pySCENIC) | 揭示BMRGs間的調(diào)控關(guān)系(如FOS的調(diào)控作用) |
| 空間共定位分析 | semla R包的mapfeatures函數(shù) | 驗證BMRGs在GBM組織中的空間共定位關(guān)系 |
表4 實驗驗證方法
| 實驗類型 | 具體方法 | 核心目的 |
|---|---|---|
| 臨床樣本驗證 | 免疫組化(IHC)、多重免疫熒光(mIF) | 驗證BMRGs在獨立隊列(17例患者)中的表達及共定位 |
| 細胞實驗 | siRNA干擾FOS表達、qRT-PCR、CCK-8 assay | 驗證FOS對ADM/AEBP1/PLOD3的調(diào)控及對細胞活力的影響 |
(三)實驗/分析設(shè)計邏輯與結(jié)果解讀(按Figure順序)
1. Figure 1:GBM中候選BM基因的篩選(二元分類機器學習)
設(shè)計邏輯:先通過數(shù)據(jù)整合和批次校正確保數(shù)據(jù)可靠性,再通過差異基因分析和多機器學習算法篩選核心BMRGs,為后續(xù)模型構(gòu)建奠定基礎(chǔ)。
關(guān)鍵步驟與結(jié)果:
Figure 1A-B:對4個獨立GBM隊列進行PCA分析,顯示批次校正前樣本聚類分散(受技術(shù)差異影響),校正后聚類更集中,數(shù)據(jù)可比性提升;
Figure 1C:Venn圖顯示手動整理的BMRGs與數(shù)據(jù)庫篩選基因的重疊情況,最終確定2518個非冗余候選基因;
Figure 1D:火山圖篩選出217個GBM與正常組織的差異表達BMRGs(adj.P.Val<0.05 & log2FC>1);
-
Figure 1E-F:通過14種機器學習算法的AUC和F-score評估,篩選出在10種以上最優(yōu)模型中出現(xiàn)的86個核心BMRGs,這些基因是GBM中BM相關(guān)的關(guān)鍵分子。
2. Figure 2:GBM中BM基因的綜合特征分析
設(shè)計邏輯:明確核心BMRGs在GBM分子亞型中的表達模式、參與的信號通路及蛋白相互作用,揭示其生物學功能。
關(guān)鍵步驟與結(jié)果:
Figure 2A-D:ssGSEA分析顯示,BMRGs活性在GBM間充質(zhì)亞型(Mesenchymal)中最高,原神經(jīng)亞型(Proneural)中最低(與侵襲性表型一致);
Figure 2E:PROGENy通路分析表明,BMRGs活性與缺氧、PI3K、VEGF等腫瘤相關(guān)通路呈顯著正相關(guān);
Figure 2F:PPI網(wǎng)絡(luò)分析顯示86個核心BMRGs間存在復(fù)雜的蛋白相互作用,節(jié)點大小反映基因重要性;
-
Figure 2G-J:GO/KEGG富集分析顯示,BMRGs主要參與ECM組織、生長因子結(jié)合、PI3K-Akt等通路,與腫瘤侵襲和微環(huán)境調(diào)控密切相關(guān)。
3. Figure 3:BMRGs風險模型的構(gòu)建與驗證
設(shè)計邏輯:基于核心BMRGs構(gòu)建預(yù)后模型,通過多隊列驗證評估模型的準確性和穩(wěn)定性,明確風險評分與患者預(yù)后的關(guān)聯(lián)。
關(guān)鍵步驟與結(jié)果:
Figure 3A:單變量Cox回歸分析篩選出31個與GBM預(yù)后相關(guān)的BMRGs;
Figure 3B:整合10種ML算法構(gòu)建117個模型,通過C-index評估,確定RSF+Lasso組合模型為最優(yōu)(平均C-index=0.607),包含4個核心基因(FOS、ADM、PLOD3、AEBP1);
Figure 3C:Kaplan-Meier生存分析顯示,高風險組患者總生存期顯著短于低風險組(所有隊列均驗證);
-
Figure 3D:1/2/3年ROC曲線顯示,模型在各隊列中均具有良好的預(yù)后預(yù)測準確性(AUC值較高)。
4. Figure 4:與已發(fā)表GBM風險模型的比較
設(shè)計邏輯:通過與40個已發(fā)表模型的對比,驗證本研究BMRGs模型的優(yōu)越性和實用性。
關(guān)鍵步驟與結(jié)果:
Figure 4A:C-index比較顯示,BMRGs模型在4個隊列中排名分別為第2、第1、第11和第4,整體優(yōu)于多數(shù)現(xiàn)有模型;
Figure 4B-C:1年和2年AUC值排名顯示,模型在短期預(yù)后預(yù)測中表現(xiàn)突出(除TCGA-GBM隊列外均排名前2);
Figure 4D:3年AUC值排名顯示,模型長期預(yù)測能力略有下降,但仍具有競爭力;
-
核心結(jié)論:BMRGs模型僅含4個基因,實用性強,在2年內(nèi)預(yù)后預(yù)測中優(yōu)勢顯著。
5. Figure 5:BMRGs風險評分對GBM免疫微環(huán)境的影響
設(shè)計邏輯:分析高/低風險組的免疫細胞浸潤差異,揭示BMRGs與腫瘤免疫微環(huán)境(TME)的關(guān)聯(lián)。
關(guān)鍵步驟與結(jié)果:
Figure 5A-C:通過ssGSEA、xCell、CIBERSORT三種算法驗證,高風險組M2樣巨噬細胞、調(diào)節(jié)性T細胞(Treg)浸潤增加,低風險組CD8+T細胞、樹突狀細胞(DC)浸潤增加;
Figure 5D-E:TimiGP分析顯示,巨噬細胞、CD8+T細胞在低風險組中為有利預(yù)后因素,在高風險組中為不利因素;
-
核心結(jié)論:高BMRGs風險評分與免疫抑制性TME相關(guān),可預(yù)測免疫細胞浸潤模式。
6. Figure 6:基于風險分組的免疫治療敏感性分析
設(shè)計邏輯:通過TIDE和IRnet算法預(yù)測不同風險組的免疫治療響應(yīng),明確BMRGs模型在免疫治療決策中的價值。
關(guān)鍵步驟與結(jié)果:
Figure 6A-E:TIDE分析顯示,高風險組CAF、MDSC浸潤增加,T細胞排斥特征增強,TIDE評分更高,提示免疫治療敏感性降低;
Figure 6F-G:IRnet分析顯示,高風險組PD-1/CTLA4免疫治療獲益評分更低;
Figure 6H-I:相關(guān)性分析顯示,風險評分與CTLA4、CD276等免疫檢查點基因表達正相關(guān),高風險組免疫檢查點基因表達更高;
-
核心結(jié)論:低BMRGs風險患者更適合免疫檢查點抑制劑治療。
7. Figure 7:基于風險分組的化療藥物篩選
設(shè)計邏輯:通過藥物敏感性分析,為不同風險組患者篩選潛在有效化療藥物,提供個性化化療策略。
關(guān)鍵步驟與結(jié)果:
Figure 7A:IC50分析顯示,高風險組對喜樹堿(Camptothecin)、阿糖胞苷(Cytarabine)等5種藥物更敏感,低風險組對多拉米莫德(Doramapimod)更敏感;
Figure 7B:相關(guān)性分析驗證,上述藥物IC50值與風險評分呈負相關(guān)(高風險組IC50更低,敏感性更高);
Figure 7C:藥物靶點分析顯示,高/低風險組中藥物靶點基因表達存在顯著差異;
-
核心結(jié)論:BMRGs風險評分可指導(dǎo)化療藥物選擇,實現(xiàn)精準化療。
8. Figure 8:基于BMRGs特征的GBM單細胞水平解析
設(shè)計邏輯:通過單細胞RNA-seq揭示BMRGs在不同細胞類型中的表達模式,明確高BMRGs表達細胞的特征。
關(guān)鍵步驟與結(jié)果:
Figure 8A:整合32例GBM患者的單細胞數(shù)據(jù),獲得109,913個細胞,UMAP圖顯示細胞聚類情況;
Figure 8B-C:鑒定出9種細胞類型(間充質(zhì)GBM、經(jīng)典GBM、T細胞等),并明確各細胞類型的標志基因和生物學功能;
Figure 8D-E:ssGSEA分析顯示,BMRGs在間充質(zhì)GBM細胞、內(nèi)皮細胞(ECs)和周細胞/CAFs中表達最高,且在間充質(zhì)GBM亞型中表達顯著高于其他亞型。

9. Figure 9:高BMRGs評分GBM細胞的增強型細胞通訊能力
設(shè)計邏輯:分析高/低BMRGs表達腫瘤細胞的細胞間通訊差異,揭示其在TME調(diào)控中的作用。
關(guān)鍵步驟與結(jié)果:
Figure 9A:根據(jù)BMRGs評分將腫瘤細胞分為高/低BM組,UMAP圖顯示兩組細胞分布;
Figure 9B-F:細胞水平GSEA顯示,高BM組腫瘤細胞富集TNFA信號、缺氧、EMT等通路;
Figure 9G-H:CellChat分析顯示,高BM組腫瘤細胞的傳入和傳出通訊強度更高,在膠原、TNF、VEGF等信號通路中作為“發(fā)送者”“接收者”的中心性評分更高;
-
核心結(jié)論:高BMRGs表達的腫瘤細胞具有更強的細胞間通訊能力,可調(diào)控TME以促進腫瘤進展。
10. Figure 10:空間轉(zhuǎn)錄組學觀察到的BMRGs共表達
設(shè)計邏輯:通過空間轉(zhuǎn)錄組學驗證BMRGs的空間共定位關(guān)系,揭示FOS的調(diào)控作用。
關(guān)鍵步驟與結(jié)果:
Figure 10A-E:SCENIC分析顯示,F(xiàn)OS(轉(zhuǎn)錄因子)的調(diào)控子活性與FOS、ADM、PLOD3、AEBP1的mRNA表達一致;
Figure 10F-G:空間轉(zhuǎn)錄組圖顯示,在原發(fā)性和復(fù)發(fā)性GBM中,F(xiàn)OS與ADM、PLOD3、AEBP1均存在空間共定位;
-
核心結(jié)論:FOS可能調(diào)控ADM、PLOD3、AEBP1的表達,且4個基因在空間上協(xié)同作用。
11. Figure 11:獨立隊列的IHC和多重免疫熒光驗證
設(shè)計邏輯:通過臨床樣本實驗驗證BMRGs的表達及共定位,確認模型的臨床可行性。
關(guān)鍵步驟與結(jié)果:
Figure 11A:CPTAC數(shù)據(jù)庫分析顯示,ADM、PLOD3、AEBP1、FOS在GBM中蛋白豐度顯著高于其他癌癥;
Figure 11B:IHC結(jié)果顯示,GBM樣本中BMRGs表達顯著高于低級別膠質(zhì)瘤(LGG);
Figure 11C:多重免疫熒光顯示,F(xiàn)OS與ADM、PLOD3、AEBP1在GBM細胞中共表達;
-
核心結(jié)論:BMRGs在GBM中高表達且共定位,模型具有臨床應(yīng)用潛力。
12. Figure 12:FOS依賴的ADM/AEBP1/PLOD3軸調(diào)控GBM細胞活力
設(shè)計邏輯:通過細胞實驗驗證FOS對其他三個BMRGs的調(diào)控作用及對腫瘤細胞增殖的影響。
關(guān)鍵步驟與結(jié)果:
Figure 12A-B:siRNA干擾FOS后,U138-MG和U251-MG細胞中FOS表達顯著下調(diào);
Figure 12C-D:FOS干擾后,ADM、AEBP1、PLOD3的mRNA表達顯著降低;
Figure 12E-F:CCK-8實驗顯示,F(xiàn)OS干擾后腫瘤細胞活力在24h、48h、72h均顯著下降;
核心結(jié)論:FOS通過調(diào)控ADM/AEBP1/PLOD3軸促進GBM細胞增殖,為治療靶點提供實驗依據(jù)。

(四)研究總結(jié)
本研究圍繞基底膜(BM)與膠質(zhì)母細胞瘤(GBM)的關(guān)聯(lián)展開,通過整合多隊列臨床數(shù)據(jù)、結(jié)合機器學習、單細胞及空間轉(zhuǎn)錄組學技術(shù),系統(tǒng)解析了BMRGs在GBM中的作用及機制。研究成功篩選出86個核心BMRGs,構(gòu)建了包含4個基因(FOS、ADM、PLOD3、AEBP1)的預(yù)后風險模型,該模型在預(yù)測GBM患者生存期、免疫治療響應(yīng)及化療藥物敏感性方面表現(xiàn)優(yōu)異,且實用性強于多數(shù)現(xiàn)有模型。機制上,高BMRGs表達與GBM間充質(zhì)亞型、免疫抑制性微環(huán)境(M2樣巨噬細胞浸潤增加、CD8+T細胞減少)相關(guān),且高BMRGs腫瘤細胞具有更強的細胞間通訊能力;FOS作為關(guān)鍵轉(zhuǎn)錄因子,可調(diào)控其他三個基因的表達,共同促進GBM進展。研究通過臨床樣本驗證和細胞實驗確認了模型的可靠性和分子機制,為GBM的精準預(yù)后評估和個性化治療(免疫治療+化療)提供了新的理論依據(jù)和工具,具有重要的臨床轉(zhuǎn)化價值









