原文鏈接:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9537943/

背景:
癌癥相關(guān)成纖維細(xì)胞 (CAF) 參與腫瘤生長、血管生成、轉(zhuǎn)移和治療耐藥性。我們試圖探索肝細(xì)胞癌(HCC)中的CAF特征,并建立基于CAF的風(fēng)險(xiǎn)特征來預(yù)測肝細(xì)胞癌患者的預(yù)后。
工具鏈接:

http://www.sxdyc.com/CAFriskModel

1、單細(xì)胞數(shù)據(jù)讀取

這里需要注意,單細(xì)胞目前的數(shù)據(jù)有三種格式,如果不清楚,可以查看之前的文檔
http://www.sxdyc.com/clusteringReduction

這里我們提供了三種格式的文件

我們以10x的數(shù)據(jù)為例

文件夾的名字就是樣本的名字,記得不要太長,也不要以數(shù)字開頭,每一個(gè)文件夾包含了三個(gè)文件

全選這四個(gè)文件夾,壓縮為zip,然后上傳即可

提交后設(shè)置任務(wù)名,等待運(yùn)行成功即可。
運(yùn)行完成后,點(diǎn)擊文件下載



2、單細(xì)胞數(shù)據(jù)過濾

這里選擇的閾值?100<umi<50000,100<單個(gè)細(xì)胞表達(dá)的基因數(shù)量<5000,線粒體的含量小于10%




3、去批次

選擇去批次的方法,當(dāng)然你也可以選擇不去批次,如果這里選擇none的話,那么結(jié)果得到的兩個(gè)圖片和第二步結(jié)果是一樣的

4、第一次聚類篩選特定的細(xì)胞亞群

選擇合適的分辨率,上傳特征基因的名字,如這里做的CAF細(xì)胞,選擇的是ACTA2,FAP,FDGFRB,NOTCH3這四個(gè)基因,輸入的這些基因 為CAF的marker基因,后面用于篩選CAF的亞群





5、特定亞群的二次聚類

在第四步中亞群3為成纖維細(xì)胞,我們提取亞群3進(jìn)行二次聚類



6、marker基因的篩選及可視化
篩選CAF小亞群的marker基因






7、copykat預(yù)測惡性細(xì)胞



8、腫瘤相關(guān)通路評分的比較





9、TCGA數(shù)據(jù)準(zhǔn)備

準(zhǔn)備一個(gè)生存數(shù)據(jù)

如果是表型缺失,怎么輸入U(xiǎn)nknown
10、新增數(shù)據(jù)集(可選)
如果這里有GEO的數(shù)據(jù)集,那這時(shí)候準(zhǔn)備一個(gè)表達(dá)譜和生存數(shù)據(jù)
其中表達(dá)譜的行為基因,列為樣本,生存數(shù)據(jù)包含三列



記得這里的數(shù)據(jù)集名字,不要出現(xiàn)中文,空格,特殊符號等等,這里可以輸入多個(gè)數(shù)據(jù)集,分批次進(jìn)行上傳
11、關(guān)鍵亞群豐度在腫瘤發(fā)生中的比較(可選)

如果該腫瘤有癌組織和癌旁組織,則可以選擇使用ssGSEA的方法預(yù)測TCGA的每一個(gè)人關(guān)于CAF小亞群的豐度。
當(dāng)然,也可以不做差異比較


12、關(guān)鍵亞群的KM曲線


13、關(guān)鍵亞群相關(guān)基因集的篩選
如果有正常組織和癌組織,可以選擇差異分析+相關(guān)性分析進(jìn)行篩選關(guān)鍵的基因

如果沒有正常組織和癌組織,就不選擇進(jìn)行差異分析,只通過相關(guān)性分析,篩選相關(guān)基因



14、基于關(guān)鍵亞群構(gòu)建風(fēng)險(xiǎn)模型

接下來使用單因素cox+lasso+逐步回歸+多因素cox分析構(gòu)建風(fēng)險(xiǎn)模型





15、獨(dú)立數(shù)據(jù)驗(yàn)證風(fēng)險(xiǎn)模型的魯棒性
通過獨(dú)立數(shù)據(jù)機(jī)驗(yàn)證風(fēng)險(xiǎn)模型的魯棒性



這里為什么出現(xiàn)這個(gè)問題呢?是因?yàn)樵摂?shù)據(jù)集的生存時(shí)間轉(zhuǎn)化為年,這個(gè)非常重要,如果不行,則跳回第十步重新運(yùn)行
16、臨床表型的預(yù)后分析
這里有6個(gè)表型,就需要準(zhǔn)備6+2=8個(gè)顏色


長寬不合適可自行調(diào)整



17、module基因的突變分析






18、module基因的相關(guān)性分析


19、module基因的GSVA分析




20、module基因與免疫的相關(guān)性分析







21、免疫治療效果的比較

使用IMvigor210數(shù)據(jù)+GSE78220驗(yàn)證高低風(fēng)險(xiǎn)免疫治療響應(yīng)和不響應(yīng)的比較

The responsiveness of risk score to PD-L1 blockade immunotherapy in IMvigor210 cohort. (A) Differences in risk scores among immunotherapy responses in the IMvigor210 cohort; (B) Distribution of immunotherapy responses among risk score groups in the IMvigor210 cohort; (C) Prognostic differences among risk score groups in the IMvigor210 cohort; (D) Prognostic differences between risk score groups in early stage patients in the IMvigor210 cohort; (E) prognostic differences between risk score groups in advanced patients in the IMvigor210 cohort; (F) prognostic differences in risk score groups in the GSE78220 cohort; (H) Distribution of immunotherapy responses among risk score groups in the GSE78220 cohort. ****P < 0.0001.
g:gse78220數(shù)據(jù)集中免疫治療響應(yīng)與不響應(yīng)風(fēng)險(xiǎn)得分的比較。
####################################
到這一步該文章基本就已經(jīng)完全復(fù)現(xiàn)了。
如果不清楚,可以仔細(xì)看一下原文。
嗶哩嗶哩鏈接:https://www.bilibili.com/video/BV1PF4m1A7D8/?spm_id_from=333.337.search-card.all.click
官網(wǎng)鏈接:http://www.sxdyc.com/course?courseId=8d5b3d10057b4fd0aa7c2eb6cfc15200
工具鏈接:http://www.sxdyc.com/CAFriskModel