fasterq-dump 人多力量大,核多干飯香
最近開始入門生信,第一次感覺到自己的頭發(fā)可能要離自己遠(yuǎn)去了。
作為濕實(shí)驗(yàn)的大佬(自封),自然是沒有什么服務(wù)器的,所以我開始了使用Windows10內(nèi)置Linux子系統(tǒng)作為入門的第一步。

作為小白用戶,感覺還是很方便的(顏色真的不會(huì)改),主要是和windows本身文件互通,在/mnt下直接可以查看其它盤的文件

今天發(fā)現(xiàn)sra轉(zhuǎn)fastq時(shí)候,使用fastq-dump的速度的速度極其感人
fastq-dump --gzip --split-e -O . SRR1039508
本身電腦配置其實(shí)還行,AMD的3600,外加32G內(nèi)存,處理一個(gè)2G不到的sra文件竟然需要1個(gè)小時(shí)。
后面發(fā)現(xiàn)生信技能樹的教程(強(qiáng)烈推薦報(bào)名上課呀?。。。〔皇峭?中還有另外一個(gè)備注
#fasterq-dump --split-files SRR11180057.sra
以我多年考六級(jí)的經(jīng)驗(yàn)來著,帶er的東西肯定更強(qiáng)(狗頭)
所以先簡單百度了一下,發(fā)現(xiàn)這個(gè)fasterq-dump支持多線程,而fastq-dump是個(gè)單線程軟件,所以小學(xué)思維,6個(gè)小學(xué)生肯定打得過一個(gè)小學(xué)生。
開始裝 fasterq-dump
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.10.8/sratoolkit.2.10.8-ubuntu64.tar.gz
#有耐心的可以等,80m的大小,但是速度只有20k左右。迅雷還能快點(diǎn)
#常規(guī)安裝
tar -xzf sratoolkit.2.10.8-ubuntu64.tar.gz
#直接解壓后就可以添加環(huán)境變量了
echo "export PATH=/home/nanyisk/sratoolkit.2.10.8-ubuntu64/bin:\$PATH ">>~/.bashrc
source ~/.bashrc
搞定之后就可以用tap鍵補(bǔ)齊了

首先查看幫助文檔

常規(guī)的不說,首先是-e,可以設(shè)置線程數(shù),再者竟然有進(jìn)度條選項(xiàng) -p,入門生信的三周中,無數(shù)次在運(yùn)行之后陷入沉思,“我在干嘛?”,“開始了嗎?”,“是不是死機(jī)了?”,有進(jìn)度條真的太友好了。其它的選項(xiàng)看不懂,先放過去了。那就先上一個(gè)數(shù)據(jù)試試。

這是幾個(gè)意思????學(xué)生信最怕否定句?。。?br> 沒辦法,他說啥就干啥唄
vdb-config --interactive
運(yùn)行之后我震驚了。。。。第一次見這種界面的東西。以我多年考六級(jí)的經(jīng)驗(yàn),默認(rèn)是最保險(xiǎn)的(default)。標(biāo)紅加下劃線的那個(gè)字母應(yīng)該就是那個(gè)選項(xiàng)的按鍵。

點(diǎn)擊f(default)之后點(diǎn)擊y(yes),再點(diǎn)o(OK),感覺這里面好像挺多東西的, 但是都不懂,就放過去了。

再來一次
nanyisk@DESKTOP-Q7CG9MK:/mnt/w/20201209-rowdata$ fasterq-dump -e 100 -p -3 -O ferd/ SRR1039508
#別問我為啥100個(gè)線程,能設(shè)置多線程的程序我都設(shè)置100個(gè)。
有進(jìn)度條真的安心呀

這速度無敵了,我自己用手機(jī)記了一下時(shí)間,只需要4分26秒(time命令到底怎么用呀!?。。?/p>

生成了read1和2兩個(gè)文件