fastqc的線程與速度測試

??上一篇文章寫了bowtie2和bwa的比較,發(fā)完之后立刻被師姐批評指正了,然后師姐又給我補(bǔ)充了一個知識,就是不同軟件都有它的最佳線程數(shù),不是線程越高就跑的越快,直接一個軟件定個24線程是不合理的。至于這個最佳線程數(shù)是多少,說明書要是沒有的話,要么自己評測,要么問問作者。
??我看了bwa的說明書,沒有相關(guān)說明,粗略的查了一下帖子也沒看到。讓我自己評測一下bwa的速度,我是嫌麻煩的,于是我就嘗試著評測一下fastqc。因?yàn)橐婚_始我就是加大了這個的使用線程,也沒考慮是不是有必要,而且這個速度也快,操作也方便,所以做個簡單的速度測試。
??軟件是fastqc,選用的對象是一個cleaned data,還是比較大的,測試腳本如下:

$ time fastqc -o singleout1/ -t 1 1.fq.gz
$ time fastqc -o singleout3/ -t 3 1.fq.gz
$ time fastqc -o singleout6/ -t 6 1.fq.gz
$ time fastqc -o singleout8/ -t 8 1.fq.gz
$ time fastqc -o singleout12/ -t 12 1.fq.gz
$ time fastqc -o singleout16/ -t 16 1.fq.gz
$ time fastqc -o singleout24/ -t 24 1.fq.gz

??結(jié)果如下:


1線程

3線程

6線程

8線程

12線程

16線程

24線程

??看到這個結(jié)果,我……有點(diǎn)吃驚的,居然都是一樣的。那我腳本里寫那么大的線程意義何在?
??所以我又加了一個測試,測試多個樣本下的不同線程的速度,當(dāng)前文件夾下有4個fq文件。測試腳本如下:

$ time fastqc -o allout1/ -t 1 *.fq.gz
$ time fastqc -o allout6/ -t 6 *.fq.gz
$ time fastqc -o allout12/ -t 12 *.fq.gz

??結(jié)果如下:


12線程

6線程

1線程

??我想大家已經(jīng)看出來了,對于單個樣本,fastqc每增加一個線程并不改變運(yùn)行速度,但是對于多個輸入文件,每增加一個線程會多并行跑一個輸入文件,就是說,比如輸入四個文件,四線程會同時跑四個文件,單線程只能一個一個跑。
??能得到一個結(jié)論還是挺開心的,那么以后在fastqc線程選擇的時候也就知道多少的線程數(shù)是有必要的。
??水平有限,要是存在什么錯誤請?jiān)u論指出!請大家多多批評指正,相互交流,共同成長,謝謝!??!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容