? ? ? ? 之前下載SRA的數(shù)據(jù),使用 prefetch -v SRA? ? --max-size 100G? 下載數(shù)據(jù),經(jīng)常會(huì)出現(xiàn)下到一半就斷網(wǎng)的情況;后來(lái)嘗試使用wget下載,但wget下載后的SRA數(shù)據(jù),在用fastq-dump轉(zhuǎn)化成fastq時(shí),會(huì)出現(xiàn)錯(cuò)誤(使用迅雷下載就不會(huì)出現(xiàn)這種問(wèn)題)。后來(lái)搜集到一種方法,現(xiàn)記錄下來(lái):
Step1:首先下載aspera并安裝
? ? ? ? ? ? ? ? wget http://download.asperasoft.com/download/sw/connect/3.7.4/aspera-connect-3.7.4.147727-linux-64.tar.gz
? ? ? ? ? ? ? ? tar -xzvf aspera-connect-3.7.4.147727-linux-64.tar.gz
? ? ? ? ? ? ? ? sh??aspera-connect-3.7.4.147727-linux-64.sh
? ? ? ? ? ? ? ? 查看是否安裝成功 cd 到家目錄,然后ls -a之后會(huì)有.aspera目錄;.aspera/connect/bin/ascp? -h???測(cè)試是否安裝成功;
?Step2:將ascp 添加到環(huán)境變量
? ? ? ? ? ? ? ?echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
? ? ? ? ? ? ? ?source ~/.bashrc
?Step3:使用prefetch下載數(shù)據(jù)
? ? ? ? ? ? ? ? prefetch -v ERR1955423 --max-size 100G
? ? ? ? ? ? ? ? ?這樣 perfetch就會(huì) 默認(rèn)aspera下載
? ? ? ? ? ? ? ? ?sra數(shù)據(jù)會(huì)下載到家目錄下的ncbi/public/sra中
?Step4:將SRA轉(zhuǎn)化為fastq(pair-end)
fastq-dump --gzip --split-3 --defline-qual '+' --defline-seq '@$ac-$si/$ri'? ?ERR1955398.sra
備忘錄-----SRA在NCBI上的存放路徑
以下是NCBI 存放SRR5483089的路徑
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR548/SRR5483090/
可見(jiàn)ftp構(gòu)成:
進(jìn)入即可看到FTP文件,可以直接下載或者通過(guò)復(fù)制鏈接用wget 下載
如果按SRP下載文件的話,構(gòu)成是
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/+SRP+SRP前三位數(shù)字?(105) +/SRP+SRP的完整登陸號(hào)(105315)
參考網(wǎng)址:
https://www.cnblogs.com/ywliao/p/7356528.html
http://www.itdecent.cn/p/19ae29e54c59