軟件簡(jiǎn)介
功能
- 統(tǒng)計(jì)并篩選DNA序列中k-mers的數(shù)目,輸出的結(jié)果為二進(jìn)制文件,能夠使用
jellyfish dump轉(zhuǎn)換成文本文件。
- 最終得到將所有reads打斷為長(zhǎng)度為k的fasta文件,從而應(yīng)用于后續(xù)的序列組裝。
軟件使用
軟件的幫助信息
Usage: jellyfish <cmd> [options] arg...
Where <cmd> is one of: count, bc, info, stats, histo, dump, merge, query, cite, mem, jf.
Options:
--version Display version
--help Display this message
示例
#統(tǒng)計(jì)both.fa中將k-mer設(shè)為31時(shí)所生成的reads的數(shù)目。其中:-t表示線程數(shù);-m表示所設(shè)定的k-mer大小;-s表示所生成的哈希表的大??;--cannonical表示規(guī)范化。默認(rèn)將結(jié)果輸出到mer_counts.jf,重定向使用-o參數(shù)。
jellyfish count -t 10 -m 31 -s 4000465651 --canonical both.fa
#將k-mer的序列輸出到文件jellyfish.kmers.fa中。在fa文件中,頭部為總的k-mer的數(shù)目,其它的都未每個(gè)k-mer的reads出現(xiàn)的次數(shù)。-L用來(lái)指定過(guò)濾掉的最低頻率,-U用來(lái)制定過(guò)濾掉的最高頻率。
jellyfish dump -L 2 mer_counts.jf > jellyfish.kmers.fa
#輸出k-mer頻率的直方圖到*.histo文件
jellyfish histo -t 10 -o jellyfish.kmers.fa.histo mer_counts.jf
其它語(yǔ)言的接口
python
#! /usr/bin/env python
import jellyfish
import sys
mf = jellyfish.ReadMerFile(sys.argv[1])
for mer, count in mf:
print("%s %d" % (mer, count))
perl
#! /usr/bin/env perl
use jellyfish;
my $mf = jellyfish::ReadMerFile->new($ARGV[0]);
while($mf->next_mer) {
print($mf->mer, " ", $mf->count, "\n");
}
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。