色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

登錄注冊寫文章

如何構(gòu)建kraken2個(gè)性化數(shù)據(jù)庫

如何構(gòu)建kraken2個(gè)性化數(shù)據(jù)庫

kraken2就不介紹了，是一款挺好用的快速比對宏基因組軟件。

現(xiàn)在有了nt數(shù)據(jù)庫下面animal的序列，那么如何構(gòu)建kraken2的數(shù)據(jù)庫呢？

首先推薦把kraken2安裝到單獨(dú)的conda環(huán)境中，而不是把kraken2直接安裝

conda install kraken2 ? ? ? ? ? ? ? ? #不推薦

這種雖然方便，但是很可能與其它軟件產(chǎn)生環(huán)境變量沖突

看了看kraken2的說明書，它提供”archaea”, “bacteria”, “plasmid”, “viral”, “human”, “fungi”, “plant”, “protozoa”, “nr”, “nt”, “env_nr”, “env_nt”, “UniVec”, “UniVec_Core”數(shù)據(jù)庫，但確實(shí)沒有動(dòng)物庫

那么自己構(gòu)建一個(gè)庫吧。

1 首先利用kraken2自身下載數(shù)據(jù)庫的功能，下載taxonomy分類庫

kraken2-build --download-taxonomy --threads 24 --db $DBNAME

2 添加nt.animal.fa

kraken2-build --add-to-library nt.animal.fa --db $DBNAME

這一步就會(huì)報(bào)錯(cuò)，因?yàn)閚t.animal.fa庫里有一些奇奇怪怪的accession，例如4W1Z_7

其實(shí)這些accession也沒問題，但kraken2就是識(shí)別不出來，好吧，那只能更改源代碼

找到kraken2安裝的目錄，修改一下libexec/scan_fasta_file.pl

注釋掉die那一行，就OK了，吐槽一下kraken2編程真嚴(yán)謹(jǐn)，如果是我這句估計(jì)都不寫

另外，需要注意的是，nt.animal.fa庫里有些很短的序列，可能只有幾十bp,也可以寫個(gè)perl把這些序列刪了，我試了試，152G的文件變成了149G，似乎用處不大

3 構(gòu)建個(gè)性化庫

kraken2-build --build --db?$DBNAME ? ? ? ? ? #當(dāng)時(shí)自己好像沒加線程，以后試試加線程

4 運(yùn)行kraken2

kraken2 --db $DB --threads 20 --paired ../s-592_NDSW56977_1.fq ../s-592_NDSW56977_2.fq --report report --output output --classified-out cseqs#.fq --unclassified-out de-s-592_NDSW56977#.fq ? ? ? ? ? ?#kraken2好處就是還能把未分類的序列paired，真優(yōu)秀，這些序列就是去除宿主的序列了

最后編輯于：2021.02.04 10:23:19

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點(diǎn)，簡書系信息發(fā)布平臺(tái)，僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

如何從NT/NR數(shù)據(jù)庫中提取子庫
最近做有關(guān)小鼠腸道微生物宏基因組，遇到兩個(gè)問題，一是數(shù)據(jù)量太大，二是宿主污染嚴(yán)重。估計(jì)宿主污染至少80%左右，因...
谷流觴閱讀 6,598評論 3贊 7
Kraken2+Bracken
1. 簡介 Kraken2是一個(gè)基于k-mer算法的高精度宏基因組序列分類軟件，能夠快速的將測序reads進(jìn)行物種...
生信記閱讀 23,322評論 34贊 15

一文看懂病原微生物檢測（下篇）
作者：biofan審稿：童蒙編輯：amethyst 繼一文看懂病原微生物檢測（上篇）[http://mp.weix...
生信阿拉丁閱讀 6,328評論 2贊 8
生信常用數(shù)據(jù)庫（四）：NR數(shù)據(jù)庫分類搭建
前言因?yàn)橥暾腘R數(shù)據(jù)庫下載下來后數(shù)據(jù)量非常龐大，在我們做序列比對的時(shí)候，尤其是很多很大的序列比對的時(shí)候，特...
geneonto閱讀 7,451評論 1贊 15
shell
#本地blast命令 formatdb -t "name" -i sequence.fasta -p F -o T...
小熊熊愛睡覺閱讀 1,258評論 0贊 1

友情鏈接更多精彩內(nèi)容

6贊7贊

贊賞

手機(jī)看全文

吉林市| 锦州市| 同江市| 长顺县| 雷山县| 金阳县| 偃师市| 河曲县| 贡山| 秭归县| 长乐市| 安新县| 昭平县| 靖宇县| 东平县| 同仁县| 普兰店市| 荔波县| 礼泉县| 同德县| 高阳县| 辽中县| 辽阳市| 福鼎市| 大竹县| 安丘市| 浦江县| 塔河县| 平乡县| 榆林市| 商洛市| 涪陵区| 乌什县| 汉源县| 安福县| 巴彦县| 金昌市| 四子王旗| 琼中| 赣榆县| 大连市|