零代碼復(fù)現(xiàn)3-肝細(xì)胞癌Anoikis相關(guān)亞群的鑒定及預(yù)后模型

網(wǎng)址:http://www.sxdyc.com/zeroCodeTool


文章解讀的鏈接:https://mp.weixin.qq.com/s?__biz=MzkxMjMxOTcyNQ==&mid=2247486770&idx=1&sn=29871428cbe7e2ed6feb580342883a2c&chksm=c10ff8b0f67871a69aa90527797e473899e2065fe2119bbc5228a134cfcbec2eb55642f1876b&token=833996379&lang=zh_CN#rd


話不多說,直接開始


共分為16步,對(duì)文章進(jìn)行復(fù)現(xiàn)

1、TCGA數(shù)據(jù)整理

選擇需要研究的腫瘤名稱如LUAD,從豆芽官網(wǎng)下載生存數(shù)據(jù),記得整理后,第一列是樣本名,第二列為生存時(shí)間,第三列為生存狀態(tài)(記得樣本名不要重復(fù),不要重復(fù))



選好參數(shù)后,直接上傳,提交,輸入任務(wù)名即可。

運(yùn)行完成后會(huì)跳出運(yùn)行成功的彈窗


我們點(diǎn)擊下載文件的位置,查看生成的文件


第一個(gè)為癌組織+癌旁組織的樣本的表達(dá)譜,第二個(gè)為癌組織和癌旁組織的樣本分組文件,第三個(gè)為樣本的生存數(shù)據(jù),第四個(gè)癌組織的表達(dá)譜數(shù)據(jù)

2、差異的anoikis相關(guān)基因集篩選

該anoikis相關(guān)的基因集來自于PMC10449303文章附件中,可以自己替換成自己關(guān)注的基因集


選擇相關(guān)的參數(shù),這里需要導(dǎo)入第一步寫入的任務(wù)名,上傳anoikils相關(guān)的基因集,差異分析中,我們使用limma包進(jìn)行差異分析,并自行輸入差異倍數(shù),選擇p值篩選的類型和范圍如下所示:


直接提交即可,等待運(yùn)行成功


在這次的分析中,總共有10000多個(gè)差異基因,Anoikis差異的基因有272個(gè)基因,這些基因的信息叫表com.gene.txt,表tcga.diff.fit.txt為閾值篩選后差異基因差異分析的結(jié)果


其中fig1a為差異分析的火山圖


3、一致性聚類構(gòu)建分子亞型

基于第二步篩選到272個(gè)差異的Anoikis基因選擇特定的方法進(jìn)行一致性聚類


以下就是一致性聚類的結(jié)果,這里只要選擇亞型的個(gè)數(shù),一般是通過KM曲線和熱圖一起選擇的,這里不做多描述,KM曲線的p值一定要小于0.05,熱圖得到的亞型的分布不能過于彌散。


4、降維分析亞型的分布

選擇亞型聚類的個(gè)數(shù)提交就可以了




5、亞型之間通路的不同特征

選擇合適的參數(shù),反復(fù)進(jìn)行分析,默認(rèn)做兩兩比較的差異通路的篩選



6、不同亞型22種免疫細(xì)胞比較

這里使用CIBERSORT的方法計(jì)算22種免疫細(xì)胞評(píng)分,并使用統(tǒng)計(jì)方法進(jìn)行檢驗(yàn),記得wilcox.test和t.test這兩種方法,只能針對(duì)兩個(gè)亞型進(jìn)行比較,而kruskal.test和anova一般是針對(duì)三個(gè)分子亞型進(jìn)行比較。




7、差異分析篩選差異基因


選擇兩兩亞型差異分析的基因,這里只有兩個(gè)亞組,所以默認(rèn)做的是C1vsC2,如果是三個(gè)亞組,可以選擇兩兩做差異,C1vsC2.C1vsC3,C2vsC3篩選出的差異基因取并集,復(fù)制在一個(gè)txt表格中

類似于這樣


8、WGCNA篩選腫瘤發(fā)生相關(guān)的基因集1


選擇上一步篩選到的差異基因,進(jìn)行WGCNA分析

9、WGCNA篩選腫瘤發(fā)生相關(guān)的基因集1

第八步運(yùn)行得到最優(yōu)的軟閾值,這里的軟閾值是R2>0.85下的最小的軟閾值,在該軟閾值下構(gòu)建無尺度拓?fù)渚W(wǎng)絡(luò),設(shè)置最小module的基因數(shù)量,并選擇75的相似度進(jìn)行融合



10、基因富集分析



11、Anoikis相關(guān)基因簇的鑒定


選擇一個(gè)WGCNA分析中篩選到最相關(guān)的基因集,將該基因集復(fù)制上傳,進(jìn)行一致性聚類

12、Anoikis相關(guān)基因簇PCA和基因表達(dá)譜分布



13、拆分TCGA數(shù)據(jù)集構(gòu)建風(fēng)險(xiǎn)模型1

將TCGA數(shù)據(jù)集按照比例拆分為訓(xùn)練集和驗(yàn)證集,在訓(xùn)練集中以p<0.001篩選預(yù)后相關(guān)的基因,通過lasso,逐步回歸,多因素cox分析構(gòu)建風(fēng)險(xiǎn)模型。




14、拆分TCGA數(shù)據(jù)集構(gòu)建風(fēng)險(xiǎn)模型2

選擇合適的隨機(jī)種子,并配置顏色,等到運(yùn)行結(jié)果






15、關(guān)鍵基因的預(yù)后和在高低風(fēng)險(xiǎn)組中表達(dá)

風(fēng)險(xiǎn)模型構(gòu)建成功后,針對(duì)這些module的基因,查看其預(yù)后價(jià)值(高低表達(dá)的KM曲線),及高低風(fēng)險(xiǎn)組中的表達(dá)差異。



16、風(fēng)險(xiǎn)得分和關(guān)鍵基因與免疫細(xì)胞的相關(guān)性分析




目前也有視頻講解:

https://www.bilibili.com/video/BV1Xp421m7VD/?spm_id_from=333.999.0.0

原文鏈接:

https://mp.weixin.qq.com/s/JMKvyHxypLgY7_SetvcvZg

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容