SRA數(shù)據(jù)(1)------SRA數(shù)據(jù)下載

一.prefetch下載:

安裝SRA Toolkit:

1.下載Toolkit:進(jìn)入下面的網(wǎng)址,選擇適合自己電腦的版本下載,網(wǎng)速不好的推薦掛后臺(tái),80M左右,不大。

https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software



2.解壓安裝: tar -zxvf? ? ?文件名

$ tar -zxvf sratoolkit.2.10.0-centos_linux64.tar.gz

sratoolkit.2.10.0-centos_linux64/

sratoolkit.2.10.0-centos_linux64/bin/

sratoolkit.2.10.0-centos_linux64/bin/abi-dump

sratoolkit.2.10.0-centos_linux64/bin/abi-dump.2

sratoolkit.2.10.0-centos_linux64/bin/abi-dump.2.10.0

sratoolkit.2.10.0-centos_linux64/bin/abi-load

sratoolkit.2.10.0-centos_linux64/bin/abi-load.2

sratoolkit.2.10.0-centos_linux64/bin/abi-load.2.10.0

sratoolkit.2.10.0-centos_linux64/bin/align-info

sratoolkit.2.10.0-centos_linux64/bin/align-info.2

...

3.配置環(huán)境:最好先pwd先查看自己的具體路徑,避免出錯(cuò),配置好之后可以?prefetch -V查看一下是否路徑添加成功.

$ ls

sratoolkit.2.10.0-centos_linux64? sratoolkit.2.10.0-centos_linux64.tar.gz

$ cd sratoolkit.2.10.0-centos_linux64/

$ ls

bin? CHANGES? example? README-blastn? README.md? README-vdb-config? schema

$ cd bin

$ pwd

/home/user/test2/sratoolkit.2.10.0-centos_linux64/bin

$ echo 'export export PATH=$PATH:/home/user/test2/sratoolkit.2.10.0-centos_linux64/bin' >> ~/.bash_profile

$ source ~/.bash_profile

$ prefetch -V

/home/user/test/sratoolkit.2.10.0-centos_linux64/bin/prefetch : 2.10.0

4.prefetch 單個(gè)數(shù)據(jù)下載:

????以SRR548905為例:

$ prefetch SRR5489805

2020-01-14T05:42:57 prefetch.2.10.0: 1) Downloading 'SRR5489805'...

2020-01-14T05:42:57 prefetch.2.10.0: Downloading via https...

...

5.prefetch批量下載數(shù)據(jù):

????獲取Accession List:

? ??????進(jìn)入NCBI的SRA數(shù)據(jù)庫(kù)輸入SRP號(hào):

獲取Accession List'

????Accession List大概長(zhǎng)這個(gè)樣子:


Accession List

$ prefetch --option-file SraAccList.txt

下載完成后,文件被存儲(chǔ)在默認(rèn)目錄:/home/usr/ncbi/public/sra/

二.wget 下載(推薦):

1.wget 單個(gè)數(shù)據(jù)下載:以SRR5489805為例,建議掛后臺(tái),如果網(wǎng)速給力的話就直接下.

? ? 獲取下載地址:


獲取SRR數(shù)據(jù)下載地址
獲取SRR數(shù)據(jù)下載地址

$ wget https://sra-download.ncbi.nlm.nih.gov/traces/sra60/SRR/005361/SRR5489805 &

[1] 29674

$ --2020-01-14 14:16:05-- https://sra-download.ncbi.nlm.nih.gov/traces/sra60/SRR/005361/SRR5489805

正在解析主機(jī) sra-download.ncbi.nlm.nih.gov (sra-download.ncbi.nlm.nih.gov)... 130.14.250.24, 130.14.250.25, 130.14.250.28

正在連接 sra-download.ncbi.nlm.nih.gov (sra-download.ncbi.nlm.nih.gov)|130.14.250.24|:443... 已連接。

已發(fā)出 HTTP 請(qǐng)求,正在等待回應(yīng)... 200 OK

長(zhǎng)度:3491558416 (3.3G) [application/octet-stream]

正在保存至: “SRR5489805.1” 0% [ ] 646,937 188KB/s 剩余 5h 1m


2.wget批量下載數(shù)據(jù):

? ? 獲取下載地址:在Send to下選擇Runinfo而不是Accession List:


獲取批量下載的地址

文件大概長(zhǎng)這個(gè)樣子:


Runinfo文件


然后把這些下載地址保存在一個(gè)新的文件中:


下載地址

然后利用wget -i 文件 直接下載:

$ nohup wget -i download_path.txt &

[1] 30328

$ nohup: 忽略輸入并把輸出追加到"nohup.out"

SRA數(shù)據(jù)的下載方式還有很多,但是我個(gè)人比較推薦wget直接下載,掛后臺(tái)穩(wěn)定高效,大家也可以搜索一下其它的下載方式,找到一個(gè)適合自己的。

SRA數(shù)據(jù)下載就只能分享這么多了,希望各位大佬多多批評(píng)指教。

下一期預(yù)告:SRA數(shù)據(jù)(2)------SRA數(shù)據(jù)處理

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容