JELLYFISH簡(jiǎn)介及使用


軟件簡(jiǎn)介

功能

  1. 統(tǒng)計(jì)并篩選DNA序列中k-mers的數(shù)目,輸出的結(jié)果為二進(jìn)制文件,能夠使用jellyfish dump轉(zhuǎn)換成文本文件。
  2. 最終得到將所有reads打斷為長(zhǎng)度為k的fasta文件,從而應(yīng)用于后續(xù)的序列組裝。

官網(wǎng)

  • 部分用戶需翻墻

GitHub主頁(yè)

幫助文檔


軟件使用

軟件的幫助信息

Usage: jellyfish <cmd> [options] arg...
Where <cmd> is one of: count, bc, info, stats, histo, dump, merge, query, cite, mem, jf.
Options:
  --version        Display version
  --help           Display this message

示例

#統(tǒng)計(jì)both.fa中將k-mer設(shè)為31時(shí)所生成的reads的數(shù)目。其中:-t表示線程數(shù);-m表示所設(shè)定的k-mer大小;-s表示所生成的哈希表的大??;--cannonical表示規(guī)范化。默認(rèn)將結(jié)果輸出到mer_counts.jf,重定向使用-o參數(shù)。
jellyfish count -t 10 -m 31 -s 4000465651  --canonical  both.fa

#將k-mer的序列輸出到文件jellyfish.kmers.fa中。在fa文件中,頭部為總的k-mer的數(shù)目,其它的都未每個(gè)k-mer的reads出現(xiàn)的次數(shù)。-L用來(lái)指定過(guò)濾掉的最低頻率,-U用來(lái)制定過(guò)濾掉的最高頻率。
jellyfish dump -L 2 mer_counts.jf > jellyfish.kmers.fa

#輸出k-mer頻率的直方圖到*.histo文件
jellyfish histo -t 10 -o jellyfish.kmers.fa.histo mer_counts.jf

其它語(yǔ)言的接口

python

#! /usr/bin/env python

import jellyfish
import sys

mf = jellyfish.ReadMerFile(sys.argv[1])
for mer, count in mf:
    print("%s %d" % (mer, count))

perl

#! /usr/bin/env perl

use jellyfish;

my $mf = jellyfish::ReadMerFile->new($ARGV[0]);
while($mf->next_mer) {
  print($mf->mer, " ", $mf->count, "\n");
}
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容