這里是佳奧!
到了數(shù)據(jù)下載這一步,之前我都是在NCBI上直接用瀏覽器下載,不過(guò)有的數(shù)據(jù)尋找鏈接比較耗時(shí),這一次開始我就使用sratoolkit來(lái)下載處理原始數(shù)據(jù)。
1 軟件安裝
1.1 Linux環(huán)境:
##新建環(huán)境
conda create -n chipseq python=2
conda activate chipseq
##確保軟件都在chipseq環(huán)境下
conda install -c bioconda trim-galore
conda install -c bioconda samtools
conda install -c bioconda deeptools 或 conda install -c bioconda/label/cf201901 deeptools
conda install -c bioconda homer
conda install -c bioconda meme 或 conda install -c bioconda/label/cf201901 meme
conda install -c bioconda macs2 或 conda install -c bioconda/label/cf201901 macs2
conda install -c bioconda bowtie
conda install -c bioconda bowtie2
1.2 R環(huán)境:
install.packages("devtools",
repos="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")
library(devtools)
BiocManager::install(c('airway','DESeq2','edgeR','limma'))
BiocManager::install(c('ChIPpeakAnno','ChIPseeker'))
##這幾個(gè)數(shù)據(jù)集包比較特殊
BiocInstaller::biocLite('TxDb.Hsapiens.UCSC.hg19.knownGene',
ask=F,suppressUpdates=T)
BiocInstaller::biocLite('TxDb.Hsapiens.UCSC.hg38.knownGene',
ask=F,suppressUpdates=T)
BiocInstaller::biocLite('TxDb.Mmusculus.UCSC.mm10.knownGene',
ask=F,suppressUpdates=T)
##如果安裝不成功的話,用這樣的方法
BiocManager::install("TxDb.Hsapiens.UCSC.hg19.knownGene",force = TRUE)
BiocManager::install("TxDb.Hsapiens.UCSC.hg38.knownGene",force = TRUE)
BiocManager::install("TxDb.Mmusculus.UCSC.mm10.knownGene",force = TRUE)
2 公共數(shù)據(jù)下載
##Linux系統(tǒng)下,新建目錄
mkdir {sra,raw,clean,align,peaks,motif,qc}
cd sra
##從文章找到數(shù)據(jù)ID,NCBI的原始數(shù)據(jù),查看并復(fù)制Accession List
https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP009883&o=acc_s%3Aa
##新建srr.list
touch srr.list
vim srr.list
$ cat srr.list
SRR391032
SRR391033
SRR391034
SRR391035
SRR391036
SRR391037
SRR391038
SRR391039
SRR391040
SRR391041
SRR391042
SRR391043
SRR391044
SRR391045
SRR391046
SRR391047
SRR391048
SRR391049
SRR391050
##下載sra文件
export PATH="$PATH:/home/kaoku/biosoft/sratoolkit/sratoolkit.3.0.0-ubuntu64/bin"##添加sratoolkit到環(huán)境變量
##批量下載代碼
cat srr.list | while read id; do ( prefetch $id & ); done

QQ截圖20220808190556.png
##下載文件在我設(shè)定的路徑/root/ncbi/
$ ls -lh
總用量 6.6G
-rw-r--r-- 1 root root 474M 8月 8 18:52 SRR391032.sra
-rw-r--r-- 1 root root 473M 8月 8 18:53 SRR391033.sra
-rw-r--r-- 1 root root 406M 8月 8 18:51 SRR391034.sra
-rw-r--r-- 1 root root 346M 8月 8 18:49 SRR391035.sra
-rw-r--r-- 1 root root 324M 8月 8 18:51 SRR391036.sra
-rw-r--r-- 1 root root 393M 8月 8 18:51 SRR391037.sra
-rw-r--r-- 1 root root 191M 8月 8 18:47 SRR391038.sra
-rw-r--r-- 1 root root 304M 8月 8 18:51 SRR391039.sra
-rw-r--r-- 1 root root 234M 8月 8 18:46 SRR391040.sra
-rw-r--r-- 1 root root 322M 8月 8 18:49 SRR391041.sra
-rw-r--r-- 1 root root 548M 8月 8 18:53 SRR391042.sra
-rw-r--r-- 1 root root 597M 8月 8 18:52 SRR391043.sra
-rw-r--r-- 1 root root 537M 8月 8 18:52 SRR391044.sra
-rw-r--r-- 1 root root 255M 8月 8 18:51 SRR391045.sra
-rw-r--r-- 1 root root 342M 8月 8 18:51 SRR391046.sra
-rw-r--r-- 1 root root 159M 8月 8 18:44 SRR391047.sra
-rw-r--r-- 1 root root 164M 8月 8 18:44 SRR391048.sra
-rw-r--r-- 1 root root 438M 8月 8 18:52 SRR391049.sra
-rw-r--r-- 1 root root 165M 8月 8 18:45 SRR391050.sra
可以看到下載成功,速度還是很快的。
下一篇我們繼續(xù)處理下載好的sra數(shù)據(jù)。
我們下一篇再見!