7+純生信,單細胞識別細胞marker+100種機器學習組合建模,機器學習組合建模取代單獨lasso回歸勢在必行!

生信小課堂


影響因子:7.3

研究概述:

皮膚黑色素瘤(SKCM)是所有皮膚惡性腫瘤中最具侵襲性的類型。本研究從GEO數(shù)據(jù)庫下載單細胞RNA測序(scRNA-seq)數(shù)據(jù)集,根據(jù)原始研究中定義的細胞標記重新注釋各種免疫細胞,以確定其特異性標志。接著通過計算免疫細胞通信網(wǎng)絡,結合對通信網(wǎng)絡的大量分析和通信模式的識別,對所有網(wǎng)絡進行了定量表征和比較。最后基于bulk RNA測序數(shù)據(jù),使用機器學習訓練了樞紐通訊細胞的特定標記物,開發(fā)了新的免疫相關預后組合。

機器學習目前在腫瘤和非腫瘤生信中越來越常見,不管是構建模型還是篩選關鍵基因,都有很出色的發(fā)揮。想做類似分析的朋友,歡迎交流!
研究結果:

一、T細胞和B細胞是SKCM免疫微環(huán)境中的主要細胞成分

1. 使用scRNA-seq數(shù)據(jù)集獲得2106個免疫細胞,使用t-SNE算法實現(xiàn)降維和無監(jiān)督聚類并選擇0.8作為最佳分辨率,觀察到最大分叉簇(圖1A)。t-SNE算法揭示了13種不同的細胞簇(圖1B)。


2. 使用“singleR”函數(shù)注釋了7種免疫細胞,“plotScoreHeatmap”函數(shù)顯示所有參考標簽中所有細胞的得分,以檢查整個數(shù)據(jù)集預測標簽的置信度(圖1C)。

3. 作者注釋了5種類型的免疫細胞簇:簇0,6,8,11為CD8 + T細胞,簇1,4,9為CD4 + T細胞,簇2,3為B細胞,簇5,10為單核細胞和樹突狀細胞,簇7為NK細胞(圖1D)。在16個樣本中,5種主要類型免疫細胞的數(shù)量和比例表現(xiàn)出高度的相似性,表明T細胞和B細胞是SKCM免疫微環(huán)境的主要組成部分(圖1E、F)。


二、單核細胞是免疫通信網(wǎng)絡中傳入和傳出信號的主要貢獻者

1. 作者在七個免疫細胞組中觀察過表達的配體或受體及其相互作用,以確定免疫細胞之間的相互作用(圖2A)。圓形圖顯示了任兩個細胞群之間的相互作用時間和相互作用的一般強度,與其他免疫細胞相比,單核細胞在免疫通訊網(wǎng)絡的輸入和輸出信號中貢獻最大(圖2B-D)。不同免疫細胞組對輸入和輸出信號的貢獻信號明顯不同(圖2E)。


2. 結合表觀和剪影指數(shù)來識別6種傳出和5種傳入模式(圖3A, D)。此外,輸入和輸出信號是細胞特異性的,而T細胞、CD8+ T細胞和NK細胞的傳入信號具有相似性(圖3B, E)。圖3C, F顯示了傳出和傳入模式的不同信號對各種細胞群的貢獻程度。


三、MRS表現(xiàn)出穩(wěn)健的DSS預測性能

1. 由于單核細胞在細胞通訊中占主導地位,故采用LOOCV框架將TCGA-SKCM中與其他免疫細胞相比在單核細胞中特異性高表達的87個生物標志物擬合到101個預測模型中。

2. 在所有驗證數(shù)據(jù)集中計算每個模型的C指數(shù)。最佳模型組合是CoxBoost和stepCox(both)具有最高的平均C指數(shù)(0.638)(圖4A)。最終建立了8基因單核細胞相關特征(MRS),包括8個基因C1QA,DAB2,F(xiàn)13A1,F(xiàn)CGR2A,F(xiàn)CGRT,HMOX1,IFITM3,SOD2。

3. 在訓練數(shù)據(jù)集TCGA-SKCM中發(fā)現(xiàn)低風險組擁有相對較長的無進展生存期(PFS)(圖4B)。高危組在訓練數(shù)據(jù)集、外部驗證數(shù)據(jù)集GSE65904和GSE54467中的疾病特異性生存期(DSS)明顯較低(圖4C-E)。

4. MRS識別的1年、3年和5年PFS(圖4F)和DSS(圖4G-I)的曲線下面積(AUC)值證明MRS是一種有效的的預測工具,具有穩(wěn)定性和強度及良好的特異性和敏感性。

5. 單因素Cox回歸分析顯示MRS、年齡、分期、T分期、N分期與DSS密切相關(圖4J)。

多因素Cox回歸分析顯示,MRS可作為SKCM患者的獨立預后因素(圖4K)。

該時間依賴性C指數(shù)表明MRS優(yōu)于常規(guī)臨床變量(圖4L)。

DCA解釋了與常規(guī)臨床變量相比,MRS可以確切地使患者受益(圖4M)。


6. 在三個單細胞外部數(shù)據(jù)集(GSE123139(圖5A),GSE120575(圖5B),GSE72056(圖5C)中,八個MRS基因表達最密集的細胞類型被確認為單核細胞,進一步證明MRS的穩(wěn)定性和可重復性。


四、轉錄組定義的亞類在生物學上不同,免疫浸潤在統(tǒng)計學上與更有利的預后相關

1. 七種免疫浸潤算法具有一致性,高危組免疫細胞浸潤始終較少(圖6A)。風險評分與淋巴細胞和M1巨噬細胞的細胞含量呈顯著正相關(圖6B)。

2. 在SKCM的免疫亞型中,低風險組IFN-γ顯性亞型的患者明顯更多,而淋巴細胞枯竭亞型的患者較少(圖6C)。ssGSEA結果一致顯示低危組具有更好的免疫功能(圖6D)。


3. 免疫濾過與較好的預后之間有統(tǒng)計學相關性。七個數(shù)據(jù)集的通路分析有力地證實了高、低風險人群的生物學獨特性。低危組淋巴細胞活化、抗原呈遞等相關通路被激活,而高危組在黑色素形成、角化等相關通路顯著富集(圖7A)。

4. HLA、免疫檢查點、趨化因子和共刺激分子在低危組高表達(圖7B)。此外,包含18種轉錄因子的細胞調(diào)控子活性譜突出了高、低風險組之間可能存在的調(diào)節(jié)模式差異(圖7C)。


五、IFITM3是MRS的核心基因,在SKCM中高表達

1. 使用“mgeneSim”函數(shù)發(fā)現(xiàn)MRS中的關鍵基因IFITM3(圖8A)。

2. 作者利用TISCH數(shù)據(jù)庫,在所有10個SKCM單細胞數(shù)據(jù)集中,定位IFITM3在免疫和非免疫細胞中的表達情況。IFITM3不僅在單核巨噬細胞中高表達,而且在微環(huán)境中的非免疫細胞和黑色素瘤細胞中也高表達(圖8B)。

3. 通過HPA數(shù)據(jù)庫的免疫組化數(shù)據(jù)發(fā)現(xiàn)IFITM3在SKCM中的蛋白水平表達也高于正常皮膚(圖8C, D)。


研究總結:

本研究創(chuàng)新地整合了scRNA-seq和Bulk RNA-seq以及機器學習工具,8基因單核細胞相關特征(MRS)被描述并被證實是一種潛在的生物標志物。此外還探討了SKCM中通信網(wǎng)絡的概況,并描述了特定的標記物IFITM3和不可或缺的細胞-單核細胞。研究結果為破譯TME和揭示SKCM的生物學機制提供了啟示。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容