SRA-toolkit使用

? ? ? ? 之前下載SRA的數(shù)據(jù),使用 prefetch -v SRA? ? --max-size 100G? 下載數(shù)據(jù),經(jīng)常會(huì)出現(xiàn)下到一半就斷網(wǎng)的情況;后來(lái)嘗試使用wget下載,但wget下載后的SRA數(shù)據(jù),在用fastq-dump轉(zhuǎn)化成fastq時(shí),會(huì)出現(xiàn)錯(cuò)誤(使用迅雷下載就不會(huì)出現(xiàn)這種問(wèn)題)。后來(lái)搜集到一種方法,現(xiàn)記錄下來(lái):

Step1:首先下載aspera并安裝

? ? ? ? ? ? ? ? wget http://download.asperasoft.com/download/sw/connect/3.7.4/aspera-connect-3.7.4.147727-linux-64.tar.gz

? ? ? ? ? ? ? ? tar -xzvf aspera-connect-3.7.4.147727-linux-64.tar.gz

? ? ? ? ? ? ? ? sh??aspera-connect-3.7.4.147727-linux-64.sh

? ? ? ? ? ? ? ? 查看是否安裝成功 cd 到家目錄,然后ls -a之后會(huì)有.aspera目錄;.aspera/connect/bin/ascp? -h???測(cè)試是否安裝成功;

?Step2:將ascp 添加到環(huán)境變量

? ? ? ? ? ? ? ?echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc

? ? ? ? ? ? ? ?source ~/.bashrc

?Step3:使用prefetch下載數(shù)據(jù)

? ? ? ? ? ? ? ? prefetch -v ERR1955423 --max-size 100G

? ? ? ? ? ? ? ? ?這樣 perfetch就會(huì) 默認(rèn)aspera下載

? ? ? ? ? ? ? ? ?sra數(shù)據(jù)會(huì)下載到家目錄下的ncbi/public/sra中

?Step4:將SRA轉(zhuǎn)化為fastq(pair-end)

fastq-dump --gzip --split-3 --defline-qual '+' --defline-seq '@$ac-$si/$ri'? ?ERR1955398.sra


備忘錄-----SRA在NCBI上的存放路徑

以下是NCBI 存放SRR5483089的路徑

ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR548/SRR5483090/

可見(jiàn)ftp構(gòu)成:

ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/+SRR+登陸號(hào)前三位數(shù)字(548)+/SRR+完整登陸號(hào)(5483089

進(jìn)入即可看到FTP文件,可以直接下載或者通過(guò)復(fù)制鏈接用wget 下載

如果按SRP下載文件的話,構(gòu)成是

ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/+SRP+SRP前三位數(shù)字?(105) +/SRP+SRP的完整登陸號(hào)(105315)


參考網(wǎng)址:

https://www.cnblogs.com/ywliao/p/7356528.html

http://www.itdecent.cn/p/19ae29e54c59

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容