生信小課堂

本文的思路是通過單細(xì)胞數(shù)據(jù)分析識別了某種免疫細(xì)胞特有的marker基因,然后利用這些基因進(jìn)行預(yù)后模型的構(gòu)建。事實上,預(yù)后模型的文章已經(jīng)不好發(fā)了,甚至有的審稿人看到預(yù)后模型就反感,因為實在是太多了,而且預(yù)測效能普遍不行。那么如何做的比這篇文章還要好呢?鑒于最近泛癌分析以及腫瘤分型分析比較好發(fā),小編做的免疫細(xì)胞marker的泛癌分析以及腫瘤分型,內(nèi)容是這些文章的2倍以上,均發(fā)表到8+雜志。所以我們在篩選到某種免疫細(xì)胞特有的marker基因后,可以對這些基因進(jìn)行泛癌分析或者腫瘤分型分析。在分型分析中再附上簡單的預(yù)后模型,但不以其為重點。這樣的思路肯定是比本篇文章內(nèi)容更多,更新穎。如果想做類似分析,歡迎交流。
研究背景:
肺癌是世界上最常見的惡性腫瘤之一,發(fā)病率和死亡率都很高。肺鱗癌(LUSC)是肺癌的主要組織學(xué)類型之一,約占所有肺癌病例的25% - 30%。近年來,免疫治療已成為一種很有前途的癌癥治療策略,但只有少數(shù)LUSC患者能從免疫檢查點抑制劑(immune checkpoint inhibitors, ICIs)治療中獲益。因此,尋找合適的生物標(biāo)志物來預(yù)測LUSC的預(yù)后和治療反應(yīng)非常迫切。單細(xì)胞RNA測序(scRNA-seq)對于靶向治療和免疫治療的發(fā)展具有重要意義(14)。近年來,scRNA-seq揭示了TME中不同的免疫細(xì)胞亞群,為定義功能性生物標(biāo)志物提供了一種新方法。鑒于這一優(yōu)勢,許多研究都專注于通過整合scRNA-seq和bulk RNA-seq數(shù)據(jù)來識別新的癌癥生物標(biāo)志物。
研究結(jié)果:
一、T細(xì)胞標(biāo)記基因表達(dá)譜的鑒定
1、本研究中使用的scRNA-seq數(shù)據(jù)來自2個LUSC腫瘤樣本的12950個細(xì)胞。圖1A顯示了檢測到的基因數(shù)量范圍、測序深度和每個樣本中線粒體含量的百分比。
2、在對數(shù)據(jù)進(jìn)行歸一化處理后,選擇了前2000個高變量基因(圖1B)。
3、采用PCA方法降維(圖1C), 15個p 值小于0.05的樣本進(jìn)行進(jìn)一步分析(圖1D)。
4、從9個聚類中共鑒定了1086個差異表達(dá)標(biāo)記基因。各聚類中標(biāo)記基因的相對表達(dá)量見熱圖(圖1E)。
5、使用tSNE算法對9個聚類進(jìn)行可視化(圖1F)。
6、使用singleR算法來注釋細(xì)胞亞群,發(fā)現(xiàn)簇2和簇4被定義為T細(xì)胞亞群(圖1G)。

二、預(yù)后模型的構(gòu)建與驗證
1、 LASSO分析確定了基于最佳lambda值的8個T細(xì)胞marker基因和相應(yīng)的系數(shù)(圖2A, B)。
2、多變量Cox回歸分析得到BTG1、JUND、IER3、ZNF331、PSAP 5個基因(圖2C)。
3、根據(jù)中位TCMGrisk(中位TCMGrisk =0.973)將患者分為高危組和低危組。TCMGrisk的散點圖顯示,隨著TCMGrisk評分的增加,OS降低,而死亡率上升(圖2D-I)。
4、與低危組相比,高危組的生存期明顯更長(P小于0.001)(圖2J)。
5、1年、3年和5年訓(xùn)練隊列的AUC分別為0.614、0.713和0.702(圖2M)。
6、試驗隊列結(jié)果顯示,低危組OS優(yōu)于高危組OS (P=0.015)(圖2K)。1、3、5年的AUC分別為0.669、0.603、0.645(圖2N)。GEO隊列結(jié)果顯示,低危組OS優(yōu)于高危組(P=0.030)(圖2L)。1年、3年和5年的AUC分別為0.661、0.628和0.590(圖2O)。

三、特征基因的差異表達(dá)
1、與正?;颊呦啾龋琹uc患者IER3表達(dá)上調(diào),而JUND、PSAP和ZNF331表達(dá)下調(diào)。
2、利用HPA數(shù)據(jù)庫的免疫組化結(jié)果進(jìn)一步評估特征基因在LUSC中的表達(dá)。IER3蛋白顯著高表達(dá)LUSC組織,抗體染色強(qiáng),染色細(xì)胞多。而JUND和PSAP蛋白在正常組織中顯著高表達(dá)。
四、諾姆圖的建立與決策曲線分析
1、通過綜合臨床因素和TCMGrisk構(gòu)建諾姆圖,分別預(yù)測LUSC患者1、3、5年的生存概率(圖3A)。
2、標(biāo)定圖顯示,觀測值與預(yù)測值高度一致(圖3B)。
3、AUC結(jié)果顯示nomogram在預(yù)測1、3、5年預(yù)后方面具有更高的臨床凈效益(圖3C E), DCA顯示nomogram在預(yù)測1、3年OS時具有最佳的臨床凈效益,而在預(yù)測5年OS時則沒有(圖3F-H)。

五、基因集合富集分析
1、高危組非小細(xì)胞肺癌通路富集(圖4)。由于這些生物通路與免疫相關(guān),并參與腫瘤免疫,進(jìn)一步分析免疫,比較兩組間的差異。

六、腫瘤免疫微環(huán)境和免疫相關(guān)基因的估計
1、免疫相關(guān)的高危組功能更活躍(圖5A)。
2、相關(guān)分析顯示,TCMGrisk與免疫評分、間質(zhì)評分呈正相關(guān)(圖5B、C)。
3、ESTIMATE算法結(jié)果顯示,高危組間質(zhì)評分、免疫評分、估計評分均顯著高于高危組(P小于0.001)(圖5D)。
4、ssGSEA算法結(jié)果發(fā)現(xiàn)高危組中T細(xì)胞CD4記憶靜息、NK細(xì)胞激活、樹突狀細(xì)胞靜息、中性粒細(xì)胞高表達(dá)(圖5E)。
5、PD-L1、CTLA-4、IDO1、PDL2、TIM-3、LAG-3、TIGIT在高危組中呈高表達(dá),而PD-1在兩個高危組中表達(dá)差異無統(tǒng)計學(xué)意義(圖5F)。
6、高危組HLA相關(guān)基因表達(dá)水平均較高(圖5G)。

七、基因突變分析
1、LUSC的總體突變概況如圖6A所示。
2、圖6B顯示了基因突變之間的相互作用,大多數(shù)基因之間的突變是同時發(fā)生的(P小于0.05)。
3、TP53、TTN和CSMD3是低危組和高危組中突變頻率最高的基因(圖6C、D)。
4、TMB表達(dá)水平在兩危組間無差異(P=0.19)(圖6E)。
5、K-M曲線顯示,高TMB組的預(yù)后優(yōu)于低TMB組(P小于0.001)(圖6F)。
6、結(jié)合模型后,低危+高TMB組的預(yù)后明顯好于高危+低TMB組(P小于0.001)(圖6G)。

八、藥物敏感性分析
1、進(jìn)一步探討低危組和高危組化療藥物IC50水平的差異(圖7A-L)。TCMGrisk可作為抗癌藥物選擇的預(yù)測因子。

總結(jié):免疫療法已成為治療癌癥的一種強(qiáng)有力的臨床策略。最近,隨著ICIs的陽性結(jié)果,人們對肺癌的免疫治療重新產(chǎn)生了興趣。然而,探索能從免疫治療中獲益的LUSC患者仍然是一個巨大的挑戰(zhàn)。目前的研究表明,scRNA-seq技術(shù)是探索腫瘤異質(zhì)性和不同細(xì)胞亞群的強(qiáng)大工具,這對確定潛在的治療靶點很重要。在本研究中,進(jìn)行了scRNAseq分析,以探索LUSC中的T細(xì)胞標(biāo)記基因,并使用訓(xùn)練隊列構(gòu)建預(yù)后特征。試驗和GEO隊列被用于進(jìn)一步評估簽名的預(yù)測能力。此外,本研究發(fā)現(xiàn)高危組的免疫評分、基質(zhì)評分、免疫細(xì)胞浸潤、免疫檢查點和體細(xì)胞突變水平較高。在高危組中,更多的免疫相關(guān)通路也被富集。