【ChIP-seq 實(shí)戰(zhàn)】二、軟件安裝和公共數(shù)據(jù)下載

這里是佳奧!

到了數(shù)據(jù)下載這一步,之前我都是在NCBI上直接用瀏覽器下載,不過(guò)有的數(shù)據(jù)尋找鏈接比較耗時(shí),這一次開始我就使用sratoolkit來(lái)下載處理原始數(shù)據(jù)。

1 軟件安裝

1.1 Linux環(huán)境:

##新建環(huán)境
conda  create -n chipseq  python=2
conda activate chipseq

##確保軟件都在chipseq環(huán)境下
conda install -c bioconda trim-galore
conda install -c bioconda samtools
conda install -c bioconda deeptools 或 conda install -c bioconda/label/cf201901 deeptools
conda install -c bioconda homer
conda install -c bioconda meme 或 conda install -c bioconda/label/cf201901 meme
conda install -c bioconda macs2 或 conda install -c bioconda/label/cf201901 macs2
conda install -c bioconda bowtie
conda install -c bioconda bowtie2

1.2 R環(huán)境:

install.packages("devtools",
               repos="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")
library(devtools) 
BiocManager::install(c('airway','DESeq2','edgeR','limma'))
BiocManager::install(c('ChIPpeakAnno','ChIPseeker'))

##這幾個(gè)數(shù)據(jù)集包比較特殊
BiocInstaller::biocLite('TxDb.Hsapiens.UCSC.hg19.knownGene',
                        ask=F,suppressUpdates=T)
BiocInstaller::biocLite('TxDb.Hsapiens.UCSC.hg38.knownGene',
                        ask=F,suppressUpdates=T)
BiocInstaller::biocLite('TxDb.Mmusculus.UCSC.mm10.knownGene',
                        ask=F,suppressUpdates=T)

##如果安裝不成功的話,用這樣的方法
BiocManager::install("TxDb.Hsapiens.UCSC.hg19.knownGene",force = TRUE)
BiocManager::install("TxDb.Hsapiens.UCSC.hg38.knownGene",force = TRUE)
BiocManager::install("TxDb.Mmusculus.UCSC.mm10.knownGene",force = TRUE)

2 公共數(shù)據(jù)下載

 ##Linux系統(tǒng)下,新建目錄
 mkdir {sra,raw,clean,align,peaks,motif,qc}
 cd sra 
 
 ##從文章找到數(shù)據(jù)ID,NCBI的原始數(shù)據(jù),查看并復(fù)制Accession List
 https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP009883&o=acc_s%3Aa
 
 ##新建srr.list
touch srr.list
vim srr.list 

$ cat srr.list
SRR391032
SRR391033
SRR391034
SRR391035
SRR391036
SRR391037
SRR391038
SRR391039
SRR391040
SRR391041
SRR391042
SRR391043
SRR391044
SRR391045
SRR391046
SRR391047
SRR391048
SRR391049
SRR391050

##下載sra文件
export PATH="$PATH:/home/kaoku/biosoft/sratoolkit/sratoolkit.3.0.0-ubuntu64/bin"##添加sratoolkit到環(huán)境變量

##批量下載代碼
cat srr.list | while read id; do ( prefetch $id & ); done
QQ截圖20220808190556.png
##下載文件在我設(shè)定的路徑/root/ncbi/
$ ls -lh
總用量 6.6G
-rw-r--r-- 1 root root 474M  8月  8 18:52 SRR391032.sra
-rw-r--r-- 1 root root 473M  8月  8 18:53 SRR391033.sra
-rw-r--r-- 1 root root 406M  8月  8 18:51 SRR391034.sra
-rw-r--r-- 1 root root 346M  8月  8 18:49 SRR391035.sra
-rw-r--r-- 1 root root 324M  8月  8 18:51 SRR391036.sra
-rw-r--r-- 1 root root 393M  8月  8 18:51 SRR391037.sra
-rw-r--r-- 1 root root 191M  8月  8 18:47 SRR391038.sra
-rw-r--r-- 1 root root 304M  8月  8 18:51 SRR391039.sra
-rw-r--r-- 1 root root 234M  8月  8 18:46 SRR391040.sra
-rw-r--r-- 1 root root 322M  8月  8 18:49 SRR391041.sra
-rw-r--r-- 1 root root 548M  8月  8 18:53 SRR391042.sra
-rw-r--r-- 1 root root 597M  8月  8 18:52 SRR391043.sra
-rw-r--r-- 1 root root 537M  8月  8 18:52 SRR391044.sra
-rw-r--r-- 1 root root 255M  8月  8 18:51 SRR391045.sra
-rw-r--r-- 1 root root 342M  8月  8 18:51 SRR391046.sra
-rw-r--r-- 1 root root 159M  8月  8 18:44 SRR391047.sra
-rw-r--r-- 1 root root 164M  8月  8 18:44 SRR391048.sra
-rw-r--r-- 1 root root 438M  8月  8 18:52 SRR391049.sra
-rw-r--r-- 1 root root 165M  8月  8 18:45 SRR391050.sra

可以看到下載成功,速度還是很快的。

下一篇我們繼續(xù)處理下載好的sra數(shù)據(jù)。

我們下一篇再見!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容