kmergenie 安裝及使用

由于需要做微生物的De novo無參組裝,查了一些資料發(fā)現(xiàn)大多軟件需要先確定K值,而kmergenie能夠根據(jù)數(shù)據(jù)的得到最佳的K值,下邊記錄一下安裝過程

依賴:

python >= 2.7?

R (r-base) (如果沒有直接使用 conda install r-base 進(jìn)行安裝)

1、使用conda安裝(失?。?/h1>

conda 是生物信息學(xué)學(xué)習(xí)的必須要掌握的軟件!??!

首先在anaconda 中查到kmergenie,搜索結(jié)果如下:

然后使用命令:

conda install?kmergenie? ?進(jìn)行安裝

安裝后使用時發(fā)現(xiàn)出現(xiàn)錯誤:

ModuleNotFoundError: No module named 'readfq'

然后我繼續(xù)用conda安裝readfq:

conda install readfq

仍然沒有解決這個問題,查找了資料說是要把readfq的依賴放到kmergenie中:

kmergenie missing readfq · Issue #37856 · bioconda/bioconda-recipes · GitHub

果斷放棄,選擇自己安裝:

2、編譯安裝

首先從官網(wǎng)(KmerGenie)下載安裝包,安裝步驟如下:

tar -xzvf?kmergenie-1.7051.tar.gz

cd?kmergenie-1.7051/

make

python setup.py install --user? (--user 沒有管理員權(quán)限的用戶要加上,不然會報錯)

完成后執(zhí)行命令試下: kergenie -h

這就安裝成功了。下邊將其添加進(jìn)環(huán)境變量就行了,一般我是更改.bashrc 文件在最后一行添加下邊內(nèi)容:

export PATH=$PATH:/public2/home/Software/kmergenie-1.7051

然后 source .bashrc 就ok啦!

3、使用

kergenie? sequence.txt? -o? kergenie_output/sample? -k 140 -l 15 -s 10 -t 10

sequence.txt 為分析文件(fastq)的絕對路徑,多個文件要換行

-k 為選擇分析最大的K值

-l 為選擇分析最小的K值

-s 最小值到最大值的步長

-t 線程數(shù)

注意:第一次分析是s可以設(shè)大點,可以根據(jù)分析結(jié)果給出的最佳K值再縮小再進(jìn)一步的分析(第一次:I:15,k:140,s:10? 第二次I:15,k:80,s:6)

參考:

基因組組裝----SOAPdenovo2 - 簡書

http://kmergenie.bx.psu.edu/README

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容