Week23 — WGCNA分析+公共數(shù)據(jù)庫挖掘你感興趣的癌癥

第23周 2018 — 10.21-10.27

原文鏈接: Application of weighted gene co-expression network analysis to identify key modules and hub genes in oral squamous cell carcinoma tumorigenesis
DOI:10.2147/OTT.S171791
期刊:Onco Targets Ther.
影響因子:2.656


導(dǎo)讀

這是一篇完全基于公共數(shù)據(jù)挖掘,沒有做任何實驗的文章,充分利用了多種數(shù)據(jù)庫、網(wǎng)絡(luò)軟件和工具,除了WGCNA的分析過程,其他部分不需要編程基礎(chǔ)。而WGCNA的分析教程太多太多,優(yōu)秀的如:

另外值得一提的是這篇文章發(fā)表的期刊:OncoTargets and Therapy,影響因子2.656,但是見刊速度驚人,從投稿到見刊總用時平均不超過2個月。如果是急于畢業(yè)等需要這種類型的文章,這篇文章的研究方法(套路)可以參考,該類型的期刊也可以關(guān)注下。

見刊速度確實快


研究方法

用到的數(shù)據(jù)庫詳細(xì)介紹

1. GEPIA (http://gepia.cancer-pku.cn/)

Tang, Z. et al. (2017) GEPIA: a web server for cancer and normal gene expression profiling and interactive analyses. Nucleic Acids Res, 10.1093/nar/gkx247.

GEPIA是2017年北京大學(xué)開發(fā)的一個腫瘤和正?;虮磉_(dá)的集分析和可視化的交互網(wǎng)站平臺。目前包括9736個腫瘤樣本和8587個正常樣本,數(shù)據(jù)分別來自TCGA數(shù)據(jù)庫和GTEx。

可以做的分析有:

  • 單個基因分析:
    任意輸入一個基因symbol,General信息里會給出該基因研究現(xiàn)狀的一個summary;基因的平均表達(dá)值在tumor和normal的bodymap中的分布;在不同癌癥
    癌癥類型中的表達(dá)(包括dot plot, bar plot); 還給出了該基因的相似基因。同時還包括差異分析,定制表達(dá)譜圖分析,生存分析,相關(guān)性分析,PCA等。
    單基因分析
  • 癌癥類型分析:
    給定一個癌癥類型,用常用的統(tǒng)計學(xué)方法和閾值做差異基因分析以及基因在染色體上的分布;還包括和癌癥類型最顯著相關(guān)的基因的生存分析
  • 多個基因分析:
    包括多個基因比較,相關(guān)性分析,降維
  • 應(yīng)用范圍:
    該數(shù)據(jù)庫主要用于癌癥分析,如果有感興趣的基因,可以使用該網(wǎng)站做差異、聚類、相關(guān)性和生存分析。

2. Human Protein Atlas database (https://www.proteinatlas.org/)

人類蛋白質(zhì)數(shù)據(jù)庫是2003年由瑞典人發(fā)起的,旨在利用不同的組學(xué)技術(shù)(包括抗體成像、質(zhì)譜、轉(zhuǎn)錄組學(xué)和系統(tǒng)生物學(xué)等方法)繪制細(xì)胞、組織和器官中的所有人類蛋白質(zhì)圖譜。
包括三部分,組織、細(xì)胞和致病圖譜:

  • Tissue Atlas
    展示蛋白質(zhì)在人體組織和器官的分布

Uhlén M et al, 2015. Tissue-based map of the human proteome. Science, PubMed: 25613900 DOI: 10.1126/science.1260419

  • Cell Atlas
    展示蛋白的的亞細(xì)胞定位

Thul PJ et al, 2017. A subcellular map of the human proteome. Science.PubMed: 28495876 DOI: 10.1126/science.aal3321

  • Pathology Atlas
    展示蛋白質(zhì)水平對癌癥患者生存的影響

Uhlen M et al, 2017. A pathology atlas of the human cancer transcriptome.
Science.PubMed: 28818916 DOI: 10.1126/science.aan2507

使用介紹:
輸入一個基因,會給出該基因的相關(guān)蛋白的描述,亞細(xì)胞定位等


再看看Tissue/Cell/Pathology都包括哪些內(nèi)容:

應(yīng)用范圍:
這篇文章中是利用該數(shù)據(jù)庫對hub genes在蛋白質(zhì)水平上驗證。做腫瘤數(shù)據(jù)挖掘的可以利用該數(shù)據(jù)庫對感興趣的基因進(jìn)行蛋白質(zhì)驗證,不用做實驗,故事還可以說的更飽滿些。(數(shù)據(jù)庫內(nèi)容很多,之后詳細(xì)介紹。)


3. CBioPortal (http://www.cbioportal.org/)

cBioPortal for Cancer Genomics 提供了探索、可視化和分析多種維度的癌癥基因組數(shù)據(jù)的網(wǎng)站資源??梢蕴剿骰蜃儺悓εR床的影響,包括多種可視化方法。



文章結(jié)果

(1) WGCNA的分析結(jié)果:

  • 樣本聚類和軟閾值的選擇
    Fig1
  • 構(gòu)建共表達(dá)網(wǎng)絡(luò)
    Fig 2
  • 顯著性模塊的選擇
    Fig 3
  • 提取顯著性模塊中的hub genes, 用cytoscape做網(wǎng)絡(luò)圖
    Fig 4
  • 模塊基因的GO和KEGG富集分析
    Table 1, 2

(2) Hub genes的驗證結(jié)果

  • 用GEPIA數(shù)據(jù)庫對hub genes進(jìn)行生存分析
    Fig 5
  • 差異基因和模塊基因的關(guān)聯(lián)分析,相互驗證
    Fig 6
  • 轉(zhuǎn)錄本水平驗證
    Fig 7
  • 翻譯水平驗證
    用的Human Protein Atlas database數(shù)據(jù)庫
    Fig 8

用CBioPortal對基因組變異和hub genes關(guān)聯(lián)分析

Fig 9

雖然這篇文章屬于套路文章,利用的也都是公共數(shù)據(jù)資源和工具,但是也有值得借鑒的地方,利用WGCNA找到hub genes后,從轉(zhuǎn)錄本水平、翻譯水平、臨床結(jié)果和基因組變異多個角度驗證;還有文中提到的3個公共數(shù)據(jù)庫資源值得挖掘和利用,尤其是對做實驗的同學(xué),完全可以用別人的工具驗證分析結(jié)果,繪制好看的圖。
君子生非異也,善假于物也。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 菲葑不棄,敝帚自珍 接口 獲取系統(tǒng)時間(毫秒) thus not work.var config Config=n...
    help_youself閱讀 452評論 0 0
  • D11 紅龍鄉(xiāng)——理塘 全程:50km 潔白的仙鶴?。≌埥栉乙浑p翅膀,不用飛到太遠(yuǎn)的地方,只到理塘就回。 早上8點...
    詩的影子閱讀 724評論 0 1
  • 目標(biāo):愿理想伴侶早日與我在一起,媽媽的身體快點好起來,微課堂、小海鮮生意大賣。 感恩冥想: 1、感恩今天早上給同事...
    小兔兔姐姐愛吃胡蘿卜閱讀 158評論 0 0
  • 天邊的星星 搖搖欲墜 千里之外的光芒 在眼前 卻抓不住 我不知道 世界盡頭的模樣 兜兜轉(zhuǎn)轉(zhuǎn) 回到原點 也許結(jié)束亦是開始
    宮泠葉閱讀 750評論 2 10
  • 「壹」 今天是2018.08.11,前幾天是立秋。 朋友圈又開始皮了: “OMG,今天是立秋,為什么感覺夏天才開始...
    Amrita_GLX閱讀 428評論 0 0

友情鏈接更多精彩內(nèi)容