零代碼復(fù)現(xiàn)2-基于TGF-β個(gè)性化純生信套路

經(jīng)過(guò)團(tuán)隊(duì)內(nèi)部加班加點(diǎn),終于零代碼復(fù)現(xiàn)2與大家見(jiàn)面了,零代碼2的分析,更側(cè)重于某一個(gè)特定的功能集,進(jìn)行直接建模,這個(gè)功能集可以從文獻(xiàn)中挖掘,KEGG 的通路,疾病的相關(guān)功能,單細(xì)胞分析等等,該工具盒適用面極廣。

http://www.sxdyc.com/zeroCodeTool


該步驟總共分14個(gè)步驟進(jìn)行

第一步:1.TCGA數(shù)據(jù)整理

該工具主要是用來(lái)整理TCGA的數(shù)據(jù)

整理一下TCGA的臨床數(shù)據(jù),從http://www.sxdyc.com/tcgaDataSet下載臨床數(shù)據(jù)


第一列為樣本名,第二列為生存時(shí)間,第三列為生存狀態(tài),前三列順序不能變。



運(yùn)行成功后,即可進(jìn)行下一步


第二步:2、關(guān)鍵基因集表達(dá)

該步主要用來(lái)分析基因集癌組織和癌旁組織表達(dá)情況,這里以箱線(xiàn)圖和熱圖進(jìn)行展示(示例數(shù)據(jù)中提供給大家的TGF-β通路,大家可以換成自己感興趣的功能集進(jìn)行分析)


基因集長(zhǎng)什么樣子呢?只要包含一列就可以了


設(shè)置圖片的顏色,大小,數(shù)據(jù)是否進(jìn)行l(wèi)og轉(zhuǎn)化,即可提交,等待運(yùn)行成功即可




通過(guò)ssGSEA的方法計(jì)算特定功能集的評(píng)分,并通過(guò)秩和檢驗(yàn)比較了癌組織和癌旁組織之間的差異


第三步:3、關(guān)鍵基因集snv突變

該工具主要用來(lái)查看我們關(guān)注的基因集snv的變化

選擇任務(wù)隊(duì)列即可





第四步:4、關(guān)鍵基因集CNV變化

該工具用量查看關(guān)鍵基因集CNV變化情況,并進(jìn)行比較



第五步:5、分子亞型的構(gòu)建

該工具針對(duì)我們關(guān)注的基因集構(gòu)建分子亞型,這里使用ConsensusClusterPlus包進(jìn)行一致性聚類(lèi),選擇聚類(lèi)方法、度量距離方法、標(biāo)準(zhǔn)化的方法

raw:不做任何處理的表達(dá)值;scale:按照樣本進(jìn)行scale和中心化,center:按照樣本進(jìn)行中心化,不進(jìn)行scale

通過(guò) ConsensusClusterPlus 包對(duì)特征基因的表達(dá)譜進(jìn)行一致性聚類(lèi),同時(shí)利用(聚類(lèi)的方法)算法和(度量距離的方法)作為度量距離,并進(jìn)行了 500 次 bootstraps,每個(gè) bootstraps 過(guò)程包括80%的訓(xùn)練集患者對(duì)樣本進(jìn)行聚類(lèi)分析,這里僅輸出2型,3型,4型的結(jié)果






第六步:6、分子亞型臨床特征比較

該工具主要用來(lái)比較分子亞型臨床特征的比較,要注意的是,這里需要選擇亞群聚類(lèi)的個(gè)數(shù),默認(rèn)是2,3,4選擇一個(gè),可以參考第五步中的2,3,4三個(gè)亞型KM曲線(xiàn),保證預(yù)后有意義即P<0.05





第七步:7、分子亞型的突變特征




第八步:8、分子亞型的免疫分析

該工具使用cibersort預(yù)測(cè)22種免疫細(xì)胞豐度,并通過(guò)秩和檢驗(yàn)比較兩個(gè)亞型之間的





第九步:9、亞型的差異分析篩選關(guān)鍵基因集

該工具使用limma針對(duì)亞型進(jìn)行差異比較




第十步:10、差異基因的富集分析

將第九步獲取的差異的基因提取,進(jìn)行GO和KEGG富集分析





第十一步:11、TCGA數(shù)據(jù)集構(gòu)建風(fēng)險(xiǎn)模型

基于TCGA的數(shù)據(jù)構(gòu)建風(fēng)險(xiǎn)模型,如果需要上傳一個(gè)基因集,一般為差異分析的差異基因,首先會(huì)通過(guò)單因素cox分析篩選預(yù)后相關(guān)的基因(這里選擇p<0.05),選擇是否進(jìn)行l(wèi)asso,逐步回歸進(jìn)行分析,繪制ROC曲線(xiàn)的時(shí)間段,以及高低風(fēng)險(xiǎn)組的顏色進(jìn)行后續(xù)分析





第十二步:12、驗(yàn)證集構(gòu)建風(fēng)險(xiǎn)模型

需要準(zhǔn)備一個(gè)geo的表達(dá)譜數(shù)據(jù)和生存數(shù)據(jù)


第一列為樣本,第二列為生存時(shí)間,第三列為生存狀態(tài),記得順序不要錯(cuò)?。?!


如果選擇訓(xùn)練集獲取的計(jì)算風(fēng)險(xiǎn)模型系數(shù)(TCGA),則選擇no,反之選擇yes



第十三步:13.不同臨床特征風(fēng)險(xiǎn)得分的比較

這里的顏色值得是臨床特征的顏色,比如T分期有四個(gè)T1-T4,就會(huì)默認(rèn)選擇前四個(gè)顏色,M分期有兩個(gè),就會(huì)默認(rèn)選擇前兩個(gè)









目前也有視頻講解:

https://www.bilibili.com/video/BV1o5411k72T/?spm_id_from=333.337.search-card.all.click

原文鏈接:

https://mp.weixin.qq.com/s/c4JodvtHu5XpkAWdDRZjpA

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容