第23周 2018 — 10.21-10.27
原文鏈接: Application of weighted gene co-expression network analysis to identify key modules and hub genes in oral squamous cell carcinoma tumorigenesis
DOI:10.2147/OTT.S171791
期刊:Onco Targets Ther.
影響因子:2.656
導(dǎo)讀
這是一篇完全基于公共數(shù)據(jù)挖掘,沒有做任何實驗的文章,充分利用了多種數(shù)據(jù)庫、網(wǎng)絡(luò)軟件和工具,除了WGCNA的分析過程,其他部分不需要編程基礎(chǔ)。而WGCNA的分析教程太多太多,優(yōu)秀的如:
另外值得一提的是這篇文章發(fā)表的期刊:OncoTargets and Therapy,影響因子2.656,但是見刊速度驚人,從投稿到見刊總用時平均不超過2個月。如果是急于畢業(yè)等需要這種類型的文章,這篇文章的研究方法(套路)可以參考,該類型的期刊也可以關(guān)注下。

研究方法

用到的數(shù)據(jù)庫詳細(xì)介紹
1. GEPIA (http://gepia.cancer-pku.cn/)
Tang, Z. et al. (2017) GEPIA: a web server for cancer and normal gene expression profiling and interactive analyses. Nucleic Acids Res, 10.1093/nar/gkx247.
GEPIA是2017年北京大學(xué)開發(fā)的一個腫瘤和正?;虮磉_(dá)的集分析和可視化的交互網(wǎng)站平臺。目前包括9736個腫瘤樣本和8587個正常樣本,數(shù)據(jù)分別來自TCGA數(shù)據(jù)庫和GTEx。

可以做的分析有:
-
單個基因分析:
任意輸入一個基因symbol,General信息里會給出該基因研究現(xiàn)狀的一個summary;基因的平均表達(dá)值在tumor和normal的bodymap中的分布;在不同癌癥
癌癥類型中的表達(dá)(包括dot plot, bar plot); 還給出了該基因的相似基因。同時還包括差異分析,定制表達(dá)譜圖分析,生存分析,相關(guān)性分析,PCA等。
單基因分析 -
癌癥類型分析:
給定一個癌癥類型,用常用的統(tǒng)計學(xué)方法和閾值做差異基因分析以及基因在染色體上的分布;還包括和癌癥類型最顯著相關(guān)的基因的生存分析 -
多個基因分析:
包括多個基因比較,相關(guān)性分析,降維 -
應(yīng)用范圍:
該數(shù)據(jù)庫主要用于癌癥分析,如果有感興趣的基因,可以使用該網(wǎng)站做差異、聚類、相關(guān)性和生存分析。
2. Human Protein Atlas database (https://www.proteinatlas.org/)
人類蛋白質(zhì)數(shù)據(jù)庫是2003年由瑞典人發(fā)起的,旨在利用不同的組學(xué)技術(shù)(包括抗體成像、質(zhì)譜、轉(zhuǎn)錄組學(xué)和系統(tǒng)生物學(xué)等方法)繪制細(xì)胞、組織和器官中的所有人類蛋白質(zhì)圖譜。
包括三部分,組織、細(xì)胞和致病圖譜:
-
Tissue Atlas
展示蛋白質(zhì)在人體組織和器官的分布
Uhlén M et al, 2015. Tissue-based map of the human proteome. Science, PubMed: 25613900 DOI: 10.1126/science.1260419
-
Cell Atlas
展示蛋白的的亞細(xì)胞定位
Thul PJ et al, 2017. A subcellular map of the human proteome. Science.PubMed: 28495876 DOI: 10.1126/science.aal3321
-
Pathology Atlas
展示蛋白質(zhì)水平對癌癥患者生存的影響
Uhlen M et al, 2017. A pathology atlas of the human cancer transcriptome.
Science.PubMed: 28818916 DOI: 10.1126/science.aan2507
使用介紹:
輸入一個基因,會給出該基因的相關(guān)蛋白的描述,亞細(xì)胞定位等

再看看Tissue/Cell/Pathology都包括哪些內(nèi)容:

應(yīng)用范圍:
這篇文章中是利用該數(shù)據(jù)庫對hub genes在蛋白質(zhì)水平上驗證。做腫瘤數(shù)據(jù)挖掘的可以利用該數(shù)據(jù)庫對感興趣的基因進(jìn)行蛋白質(zhì)驗證,不用做實驗,故事還可以說的更飽滿些。(數(shù)據(jù)庫內(nèi)容很多,之后詳細(xì)介紹。)
3. CBioPortal (http://www.cbioportal.org/)
cBioPortal for Cancer Genomics 提供了探索、可視化和分析多種維度的癌癥基因組數(shù)據(jù)的網(wǎng)站資源??梢蕴剿骰蜃儺悓εR床的影響,包括多種可視化方法。

文章結(jié)果
(1) WGCNA的分析結(jié)果:
-
樣本聚類和軟閾值的選擇
Fig1 -
構(gòu)建共表達(dá)網(wǎng)絡(luò)
Fig 2 -
顯著性模塊的選擇
Fig 3 -
提取顯著性模塊中的hub genes, 用cytoscape做網(wǎng)絡(luò)圖
Fig 4 -
模塊基因的GO和KEGG富集分析
Table 1, 2
(2) Hub genes的驗證結(jié)果
-
用GEPIA數(shù)據(jù)庫對hub genes進(jìn)行生存分析
Fig 5 -
差異基因和模塊基因的關(guān)聯(lián)分析,相互驗證
Fig 6 -
轉(zhuǎn)錄本水平驗證
Fig 7 -
翻譯水平驗證
用的Human Protein Atlas database數(shù)據(jù)庫
Fig 8
用CBioPortal對基因組變異和hub genes關(guān)聯(lián)分析
Fig 9

雖然這篇文章屬于套路文章,利用的也都是公共數(shù)據(jù)資源和工具,但是也有值得借鑒的地方,利用WGCNA找到hub genes后,從轉(zhuǎn)錄本水平、翻譯水平、臨床結(jié)果和基因組變異多個角度驗證;還有文中提到的3個公共數(shù)據(jù)庫資源值得挖掘和利用,尤其是對做實驗的同學(xué),完全可以用別人的工具驗證分析結(jié)果,繪制好看的圖。
君子生非異也,善假于物也。









