SRA公共數據下載

下載安裝SRA Toolkit

網址:https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit

#下載
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/version/package_for_your_server.tar.gz
#解壓
tar -zvxf package_for_your_server.tar.gz
#更新環(huán)境變量
vi ~/.bashrc
export PATH='/path/to/sratoolkit/bin:$PATH'
alias prefetch='/path/to/sratoolkit/bin/prefetch' #不然會報錯no such file or directory
source ~/.bashrc

查找數據集ID

一般在文章Methods或者Data Availability部分

建立Accession List

點擊這里方便批量下載

點擊建立全部數據的列表

如果只需要一部分數據也可以自行勾選

分割Accession List

如果數據太多,可以分開成幾個列表同時下載,加快速度

split -l 10 -d SraAccList.txt SraAccList_ #每10行切一刀,前綴SraAccList_,后綴2位數字

得到

SraAccList_00
SraAccList_01
...
SraAccList_21

下載數據

cd path/to/save/files
nohup prefetch --option-file SraAccList.txt --max-size 400G > sra.log 2>&1 &
#默認max-size是20G,如果夠了就不用改
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容