TCGA數(shù)據(jù)庫挖掘-腎細(xì)胞癌相關(guān)biomiarker篩選案例解析

嫌色細(xì)胞癌屬于腎細(xì)胞癌的一種,約占4-5%。利用公共數(shù)據(jù)庫數(shù)據(jù)篩選此類癌癥的相關(guān)biomarker進(jìn)行有效的臨床診斷和預(yù)后也是公共數(shù)據(jù)分析的一個(gè)方向。這里就給大家介紹一篇文獻(xiàn):利用WGCNA鑒定嫌色細(xì)胞癌biomarker。

數(shù)據(jù)來源

從TCGA數(shù)據(jù)庫下載嫌色細(xì)胞癌樣品相關(guān)數(shù)據(jù),共獲取66/25個(gè)相關(guān)樣品的表達(dá)譜數(shù)據(jù),同時(shí)得到臨床性狀。同時(shí)利用GEO數(shù)據(jù)庫下載數(shù)據(jù)(GSE15641)后期篩選和驗(yàn)證分析。

數(shù)據(jù)分析

1.數(shù)據(jù)處理與差異分析

從TCGA數(shù)據(jù)庫獲取的表達(dá)譜數(shù)據(jù),利用R包“DEseq2”進(jìn)行差異表達(dá)分析,進(jìn)而篩選差異基因。最終以adj.P.value<0.05 ?& |log2FC| ≥0.585,獲取了2215個(gè)差異基因(1748 up-regulated / 384 down-reguated)。GSE15641數(shù)據(jù)利用GEO2R進(jìn)行差異分析,基于P.value<0.05 & |log2FC|>1 篩選到1794 個(gè)差異基因(884 up-regulated / 910 down-reguated),該部分篩選結(jié)果用于biomarker的相關(guān)驗(yàn)證。

2.加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析

TCGA數(shù)據(jù)篩選出的2215個(gè)差異基因參與WGCNA分析,power值選定5(R2>0.85),最終獲得8個(gè)有效模塊(加上grey為9,見下圖A),結(jié)合臨床性狀分析結(jié)果表明Brown模塊與pathologic_stage、survival_status等相關(guān)性更明顯(見下圖B)。

其中Brown模塊內(nèi)GS與MM分析結(jié)果顯示,該模塊內(nèi)的基因與pathologic_stage顯著相關(guān)(見下圖),并基于MM高于0.8,GS高于0.2 篩選出了39個(gè)基因進(jìn)行后期分析。

3.重要模塊基因功能富集

針對(duì)Brown模塊內(nèi)的基因功能進(jìn)行富集,從而判斷這些差異基因在嫌色細(xì)胞癌中所起到的主要作用,GO富集結(jié)果顯示,有絲分裂細(xì)胞周期轉(zhuǎn)換、有絲分裂紡錘體組裝、有絲分裂紡錘體組織,細(xì)胞周期的調(diào)節(jié)過程等相關(guān)功能顯著富集;KEGG富集結(jié)果表明,細(xì)胞周期、卵母細(xì)胞減數(shù)分裂、孕酮介導(dǎo)的卵母細(xì)胞成熟等途徑顯著富集(見下圖)。

4.蛋白互作分析

為探索基因之間的蛋白互作關(guān)系,利用string數(shù)據(jù)庫進(jìn)行分析,最終基于brown模塊所有基因獲取了一個(gè)蛋白質(zhì)互作網(wǎng)絡(luò),并借助Cytoscape軟件中的MCODE軟件,以k-core=2等閾值,篩選出其中關(guān)系最緊密的子網(wǎng)絡(luò),涉及了32個(gè)基因(下圖),其中和基于模塊和性狀分析篩選的39個(gè)基因的重合有29個(gè),該部分29個(gè)基因作為候選基因進(jìn)一步驗(yàn)證。

5.篩選與驗(yàn)證

29個(gè)候選基因,結(jié)合GSE15641篩選到的差異基因,屬于共有的基因有4個(gè),其中變化趨勢(shì)一致的有三個(gè):SKA1、ERCC6L、GTSE1,此三基因在癌癥樣本和正常樣本表達(dá)和統(tǒng)計(jì)分析情況見下圖(A:TCGA,B: GSE15641)。

此外,進(jìn)一步于GEPIA網(wǎng)站進(jìn)行KM生存分析,最終結(jié)果顯示SKA1、ERCC6L和總體生存時(shí)間更顯著相關(guān)(見下圖)。

結(jié)論

作者利用TCGA和GEO數(shù)據(jù)庫中兩項(xiàng)數(shù)據(jù)進(jìn)行了嫌色細(xì)胞癌biomarker基因的挖掘分析,并且利用了多個(gè)在線網(wǎng)站工具進(jìn)行了功能和互作網(wǎng)絡(luò)方面的驗(yàn)證,最終結(jié)合前人的研究和自己的驗(yàn)證分析發(fā)現(xiàn)了兩個(gè)基因SKA1、ERCC6L對(duì)于嫌色細(xì)胞癌的臨床預(yù)后可能具備重要作用。

參考文獻(xiàn):Yin, X. , Wang, J. , & Zhang, J. . (2018). Identification of biomarkers of chromophobe renal cell carcinoma by weighted gene co-expression network analysis.?Cancer Cell International,18(1).

如果你對(duì)TCGA數(shù)據(jù)挖掘有興趣的話,可以學(xué)習(xí)我們的TCGA相關(guān)課程。

《TCGA-生存分析》

https://study.163.com/course/introduction/1005645022.htm?share=1&shareId=1031484705

?《TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析》

https://study.163.com/course/introduction/1006360042.htm?share=1&shareId=1031484705

《TCGA-轉(zhuǎn)錄因子調(diào)控》

https://study.163.com/course/introduction/1005807030.htm?share=1&shareId=1031484705

更多技能學(xué)習(xí)鏈接:

http://m.study.163.com/provider/400000000234009/index.htm?share=1&shareId=1031484705

更多生物信息課程:

1. 文章越來越難發(fā)?是你沒發(fā)現(xiàn)新思路,基因家族分析發(fā)2-4分文章簡單快速,學(xué)習(xí)鏈接:基因家族分析實(shí)操課程、基因家族文獻(xiàn)思路解讀

2. 轉(zhuǎn)錄組數(shù)據(jù)理解不深入?圖表看不懂?點(diǎn)擊鏈接學(xué)習(xí)深入解讀數(shù)據(jù)結(jié)果文件,學(xué)習(xí)鏈接:轉(zhuǎn)錄組(有參)結(jié)果解讀;轉(zhuǎn)錄組(無參)結(jié)果解讀

3. 轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA,提升你的文章檔次,學(xué)習(xí)鏈接:WGCNA-加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析

4. 轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘?學(xué)習(xí)鏈接:轉(zhuǎn)錄組標(biāo)準(zhǔn)分析后的數(shù)據(jù)挖掘、轉(zhuǎn)錄組文獻(xiàn)解讀

5.微生物16S/ITS/18S分析原理及結(jié)果解讀OTU網(wǎng)絡(luò)圖繪制、cytoscape與網(wǎng)絡(luò)圖繪制課程

6. 生物信息入門到精通必修基礎(chǔ)課,學(xué)習(xí)鏈接:linux系統(tǒng)使用perl入門到精通、perl語言高級(jí)R語言畫圖

7. 醫(yī)學(xué)相關(guān)數(shù)據(jù)挖掘課程,不用做實(shí)驗(yàn)也能發(fā)文章,學(xué)習(xí)鏈接:TCGA-差異基因分析、GEO芯片數(shù)據(jù)挖掘、GSEA富集分析課程、TCGA臨床數(shù)據(jù)生存分析、TCGA-轉(zhuǎn)錄因子分析TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析

8.其他課程鏈接:二代測序轉(zhuǎn)錄組數(shù)據(jù)自主分析、NCBI數(shù)據(jù)上傳、二代測序數(shù)據(jù)解讀。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容