- GDCRNATools是一個R軟件包,用于下載,組織和綜合分析GDC中的lncRNA,mRNA和miRNA數據
介紹
- The Genomic Data Commons (GDC,基因組數據庫) 保存有美國國家癌癥研究所(NCI)計劃的標準化基因組,臨床和生物樣本數據,包括癌癥基因組圖譜(TCGA)和產生有效治療的治療性應用研究(TARGET),它也接受高質量的數據集和來自非NCI支持的癌癥研究計劃,例如來自Foundation Medicine的基因組數據。
- GDCRNATools是一個R軟件包,它提供了一個標準,易于使用和理解的方法,用于下載,組織和綜合分析GDC門戶中的RNA表達數據,重點在于解密與癌癥相關的lncRNA-mRNA相關ceRNA調控網絡。
- 可以使用GDCRNATools進行許多分析,包括差異基因表達分析(limma(Ritchie等人2015),edgeR(Robinson,McCarthy和Smyth 2010)和DESeq2(Love,Huber和Anders 2014)),單變量生存分析。 (CoxPH和KM),競爭性內源RNA網絡分析(超幾何測試,Pearson相關分析,調節(jié)相似性分析,靈敏度Pearson部分相關)和功能富集分析(GO,KEGG,DO)。 除了一些常規(guī)的可視化方法(例如火山圖,散點圖和氣泡圖等)外,GDCRNATools還開發(fā)了三個簡單的閃亮應用程序,使用戶可以在本地網頁上可視化結果。
- 這個用戶友好的程序包使研究人員可以通過簡單地運行一些功能并整合其流水線來執(zhí)行分析,例如分子亞型分類,加權相關網絡分析(WGCNA)(Langfelder和Horvath 2008)以及TF-miRNA協同調控網絡分析 等輕松地導入工作流程。
安裝
- GDCRNATools現在可以在Bioconductor中查到。雖然安裝 GDCRNATools有各種方式,但是我們只介紹R代碼安裝。
#先安裝BiocManager,之后就可以安裝其它包了
#但是對于R 3.5 以下的版本,依舊需要使用BiocLite
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install( )
###大量安裝 ###
BiocManager::install(c('limma', 'edgeR', 'DESeq2', 'clusterProfiler', 'DOSE', 'org.Hs.eg.db', 'biomaRt', 'BiocParallel'))
install.packages(c('shiny', 'jsonlite', 'rjson', 'survival', 'survminer', 'ggplot2', 'gplots', 'Hmisc'))
### 單個安裝 ###
BiocManager::install('limma')
BiocManager::install('edgeR')
BiocManager::install('DESeq2')
BiocManager::install('clusterProfiler')
BiocManager::install('DOSE')
BiocManager::install('org.Hs.eg.db')
BiocManager::install('biomaRt')
BiocManager::install('BiocParallel')
install.packages('shiny')
install.packages('jsonlite')
install.packages('rjson')
install.packages('survival')
install.packages('survminer')
install.packages('ggplot2')
install.packages('gplots')
install.packages('Hmisc')
-
操作手冊
1、下載
提供了兩種方法來下載Gene Expression Quantification (HTSeq-Counts),Isoform Expression Quantification 亞型表達定量(BCGSC miRNA分析)和Clinical (Clinical Supplement) data:
- 手動下載
第一步: 在 GDC網站上下載 GDC Data Transfer Tool
第二步: 將數據加載到 GDC cart, 下載 cart中的manifest file 和 metadata
第三步: 通過manifest file,用gdcRNADownload()函數下載 - 自動下載
通過在gdcRNADownload()函數中指定RNAseq 和 miRNAs data數據的project.id和data.type自動下載GDC Data Transfer Tool, manifest file, 和 data ; 然后 通過gdcClinicalDownload()函數下載臨床數據。 - 另外,用戶還可以使用 TCGAbiolinks(Colaprico et al. 2016)中開發(fā)的API方法或TCGA-Assembler(Zhu, Qiu, and Ji 2014)方法從GDC下載數據。
1.1 下載說明
-
a)安裝GDC Data Transfer Tool gdc-client
從 GDC 網站下載 GDC Data Transfer Tool 然后解壓縮該文件

image.png

image.png
-
b)從 GDC Data Portal下載 manifest file 和 metadata

image.png
-
c)下載RNAseq / miRNAs/ Clinical data
####### 下載 RNAseq 數據 #######
gdcRNADownload(manifest = 'TCGA-PRAD/TCGA-PRAD.RNAseq.gdc_manifest.2017-11-23T14-40-52.txt',
directory = 'TCGA-PRAD/RNAseq')
####### 下載 miRNAs 數據 #######
gdcRNADownload(manifest = 'TCGA-PRAD/TCGA-PRAD.miRNAs.gdc_manifest.2017-11-22T15-36-57.txt',
directory = 'TCGA-PRAD/miRNAs')
####### 下載 Clinical 數據 #######
gdcRNADownload(manifest = 'TCGA-PRAD/TCGA-PRAD.Clinical.gdc_manifest.2017-11-23T14-42-01.txt',
directory = 'TCGA-PRAD/Clinical')