經(jīng)過(guò)團(tuán)隊(duì)內(nèi)部加班加點(diǎn),終于零代碼復(fù)現(xiàn)2與大家見(jiàn)面了,零代碼2的分析,更側(cè)重于某一個(gè)特定的功能集,進(jìn)行直接建模,這個(gè)功能集可以從文獻(xiàn)中挖掘,KEGG 的通路,疾病的相關(guān)功能,單細(xì)胞分析等等,該工具盒適用面極廣。
http://www.sxdyc.com/zeroCodeTool

該步驟總共分14個(gè)步驟進(jìn)行
第一步:1.TCGA數(shù)據(jù)整理
該工具主要是用來(lái)整理TCGA的數(shù)據(jù)
整理一下TCGA的臨床數(shù)據(jù),從http://www.sxdyc.com/tcgaDataSet下載臨床數(shù)據(jù)

第一列為樣本名,第二列為生存時(shí)間,第三列為生存狀態(tài),前三列順序不能變。


運(yùn)行成功后,即可進(jìn)行下一步

第二步:2、關(guān)鍵基因集表達(dá)
該步主要用來(lái)分析基因集癌組織和癌旁組織表達(dá)情況,這里以箱線(xiàn)圖和熱圖進(jìn)行展示(示例數(shù)據(jù)中提供給大家的TGF-β通路,大家可以換成自己感興趣的功能集進(jìn)行分析)

基因集長(zhǎng)什么樣子呢?只要包含一列就可以了

設(shè)置圖片的顏色,大小,數(shù)據(jù)是否進(jìn)行l(wèi)og轉(zhuǎn)化,即可提交,等待運(yùn)行成功即可



通過(guò)ssGSEA的方法計(jì)算特定功能集的評(píng)分,并通過(guò)秩和檢驗(yàn)比較了癌組織和癌旁組織之間的差異

第三步:3、關(guān)鍵基因集snv突變
該工具主要用來(lái)查看我們關(guān)注的基因集snv的變化
選擇任務(wù)隊(duì)列即可




第四步:4、關(guān)鍵基因集CNV變化
該工具用量查看關(guān)鍵基因集CNV變化情況,并進(jìn)行比較



第五步:5、分子亞型的構(gòu)建
該工具針對(duì)我們關(guān)注的基因集構(gòu)建分子亞型,這里使用ConsensusClusterPlus包進(jìn)行一致性聚類(lèi),選擇聚類(lèi)方法、度量距離方法、標(biāo)準(zhǔn)化的方法
raw:不做任何處理的表達(dá)值;scale:按照樣本進(jìn)行scale和中心化,center:按照樣本進(jìn)行中心化,不進(jìn)行scale
通過(guò) ConsensusClusterPlus 包對(duì)特征基因的表達(dá)譜進(jìn)行一致性聚類(lèi),同時(shí)利用(聚類(lèi)的方法)算法和(度量距離的方法)作為度量距離,并進(jìn)行了 500 次 bootstraps,每個(gè) bootstraps 過(guò)程包括80%的訓(xùn)練集患者對(duì)樣本進(jìn)行聚類(lèi)分析,這里僅輸出2型,3型,4型的結(jié)果





第六步:6、分子亞型臨床特征比較
該工具主要用來(lái)比較分子亞型臨床特征的比較,要注意的是,這里需要選擇亞群聚類(lèi)的個(gè)數(shù),默認(rèn)是2,3,4選擇一個(gè),可以參考第五步中的2,3,4三個(gè)亞型KM曲線(xiàn),保證預(yù)后有意義即P<0.05




第七步:7、分子亞型的突變特征




第八步:8、分子亞型的免疫分析
該工具使用cibersort預(yù)測(cè)22種免疫細(xì)胞豐度,并通過(guò)秩和檢驗(yàn)比較兩個(gè)亞型之間的





第九步:9、亞型的差異分析篩選關(guān)鍵基因集
該工具使用limma針對(duì)亞型進(jìn)行差異比較



第十步:10、差異基因的富集分析
將第九步獲取的差異的基因提取,進(jìn)行GO和KEGG富集分析




第十一步:11、TCGA數(shù)據(jù)集構(gòu)建風(fēng)險(xiǎn)模型
基于TCGA的數(shù)據(jù)構(gòu)建風(fēng)險(xiǎn)模型,如果需要上傳一個(gè)基因集,一般為差異分析的差異基因,首先會(huì)通過(guò)單因素cox分析篩選預(yù)后相關(guān)的基因(這里選擇p<0.05),選擇是否進(jìn)行l(wèi)asso,逐步回歸進(jìn)行分析,繪制ROC曲線(xiàn)的時(shí)間段,以及高低風(fēng)險(xiǎn)組的顏色進(jìn)行后續(xù)分析




第十二步:12、驗(yàn)證集構(gòu)建風(fēng)險(xiǎn)模型
需要準(zhǔn)備一個(gè)geo的表達(dá)譜數(shù)據(jù)和生存數(shù)據(jù)

第一列為樣本,第二列為生存時(shí)間,第三列為生存狀態(tài),記得順序不要錯(cuò)?。?!

如果選擇訓(xùn)練集獲取的計(jì)算風(fēng)險(xiǎn)模型系數(shù)(TCGA),則選擇no,反之選擇yes



第十三步:13.不同臨床特征風(fēng)險(xiǎn)得分的比較
這里的顏色值得是臨床特征的顏色,比如T分期有四個(gè)T1-T4,就會(huì)默認(rèn)選擇前四個(gè)顏色,M分期有兩個(gè),就會(huì)默認(rèn)選擇前兩個(gè)









目前也有視頻講解:
https://www.bilibili.com/video/BV1o5411k72T/?spm_id_from=333.337.search-card.all.click
原文鏈接:
https://mp.weixin.qq.com/s/c4JodvtHu5XpkAWdDRZjpA