學(xué)習(xí)最好的方式就是分享。
最近看到一個(gè)在R上進(jìn)行的RNA-seq 分析流程,恰好自己也有過(guò)RNA-seq分析的經(jīng)驗(yàn),所以就想結(jié)合以前的經(jīng)驗(yàn)分享這個(gè)流程出來(lái)。
P.S. RNA-seq 分析有多種流程,本文僅是舉出其中一個(gè)例子,拋磚引玉。

本文將要介紹的是由Combine Australia所提供的一個(gè)針對(duì)有參基因組的基因差異表達(dá)分析流程。
分析流程的基本信息
- 目標(biāo)物種 : mouse(小鼠)
- 組織 : mammary gland(乳腺)
- 生理狀態(tài):
- virgin(未懷孕)
- pregnant(懷孕)
- lactating (產(chǎn)后哺乳期)
- 細(xì)胞類型:
- basal stem-cell enriched cells (B)
- committed luminal cells (L)
- Six groups (3 conditions x 2 cell types) with 2 biological replicates per group
- 該文章已經(jīng)發(fā)表在Nature cell biology:
- ‘EGF-mediated induction of Mcl-1 at the switch to lactation is essential for alveolar cell survival’ (Fu et al. 2015)published in Nature Cell Biology, with both sequence and counts available from Gene Expression Omnibus database (GEO) under accession number GSE60450
流程
: Alignment and Counting(該部分需要在linux環(huán)境或mac os系統(tǒng)中完成)
本次文章也將以系列的形式呈現(xiàn),想翻看特定文章的朋友,點(diǎn)該流程目錄的相應(yīng)部分即可。
數(shù)據(jù)
感興趣的朋友也可以下載本次分析所需要的數(shù)據(jù)集,跟著動(dòng)手嘗試:https://figshare.com/s/1d788fd384d33e913a2a
配置
安裝了R語(yǔ)言(3.5.0以上)及R studio(可選)
需要的R包:
limma,edgeR,gplots,org.Mm.eg.db,EDASeq,RColorBrewer,GO.db,BiasedUrn,DESeq2,Glimma,Rsubread.
這里我們推薦使用Bioconductor安裝以上這些包,要注意的是Bioconductor更新后,將R包安裝的功能轉(zhuǎn)移到BiocManager::install,見下:
> source("http://bioconductor.org/biocLite.R")
Error: With R version 3.5 or greater, install Bioconductor packages
using BiocManager; see https://bioconductor.org/install
這里要注意Glimma包需要通過(guò)在Bioconductor中下載其源文件來(lái)安裝

源文件的安裝方法之一
源文件可以在R studio中安裝,在上方工具欄中選擇"Tools --> Install packages"。
然后,在彈出的窗口中點(diǎn)擊"Install from"下拉菜單中選擇Package Archive File。

最后,選擇下載的源文件包即可安裝。
待續(xù)。