DU6:記錄下載sra數(shù)據(jù)的幾種方法

一、從NCBI獲取SRA編號(hào)

獲取SRA編號(hào)

SraAccList.txt

二、用不同方法進(jìn)行下載

1、aspera下載

#安裝
wget http://download.asperasoft.com/download/sw/connect/3.7.4/aspera-connect-3.7.4.147727-linux-64.tar.gz
tar -zxvf aspera-connect-3.7.4.147727-linux-64.tar.gz
sh aspera-connect-3.7.4.147727-linux-64.sh
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
#下載
ascp -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 –T -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR404/SRR4042142/SRR4042142.sra ./SRA_data/
#-i PRIVATE-KEY-FILE             Private-key file name (id_rsa) 
#-k RESUME-LEVEL                 Resume criterion: 0,3,2,1
#-T                              Disable encryption
#-l MAX-RATE                     Max transfer rate

aspera下載速度較快,下載下來為sra格式,需要轉(zhuǎn)換為fastq格式
2、sratoolkit下載

#安裝
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.2-1/sratoolkit.2.8.2-1-centos_linux64.tar.gz
tar -zxvf sratoolkit.2.8.2-1-centos_linux64.tar.gz
echo 'export export PATH=~/sratoolkit/sratoolkit.2.8.2-1-centos_linux64/bin/:$PATH' >> ~/.bashrc
source ~/.bashrc

用prefetch工具下載

prefetch -c SRR4042142
#-c|--check-all                   double-check all refseqs

prefetch下載數(shù)據(jù)為sra格式,在home目錄的ncbi文件夾下
用fastq-dump工具下載

fastq-dump -X 5 -Z SRR390728
#-X|--maxSpotId <rowid>           Maximum spot id
#-Z|--stdout                      Output to stdout, all split data become

fastq-dump下載直接轉(zhuǎn)換為fastq格式
若為雙端測(cè)序,用fastq-dump --split-3 SRR4042142下載產(chǎn)生兩個(gè)文件
3、aria2c下載

aria2c -j 20 ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR404/SRR4042142/SRR4042142.sra

并行下載
4、wget下載

wget ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR404/SRR4042142/SRR4042142.sra

三、批量下載

SRA數(shù)據(jù)下載鏈接前半部分都一致,只需要修改后面的編號(hào)

#/sra/sra-instant/reads/ByRun/sra/{SRR|ERR|DRR}/<first 6 characters of accession>/<accession>/<accession>.sra
for id in `cat SraAccList.txt`
    do ascp -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 –T -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/{SRR|ERR|DRR}/substr($id,1,6)/$id/$id.sra ./SRA_data/
done

參考鏈接:
https://www.ncbi.nlm.nih.gov/books/NBK158899/#SRA_download.downloading_sra_data_using

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容