用verkko組裝基因組

背景介紹

verkko是一個最新的可以應(yīng)用于二倍體基因組T2T(telomere-to-telomere)級別的基因組組裝的組裝軟件。

2022年9月14號李恒在主題為PacBio HiFi數(shù)據(jù)組裝及應(yīng)用的在線會議上提到過,“目前為止verkko可能是比hifiasm效果更佳的組裝二倍體T2T基因組的軟件。”

那它為什么這么厲害呢?

根據(jù)GitHub的介紹,verkko是一個混裝PacBio HiFi和ONT數(shù)據(jù)的基因組組裝軟件,基于Canu的糾錯模塊將PacBio HiFi reads糾錯后建立multiplex de Bruijn圖, 再將ONT序列對齊(align)到圖上,逐步解決循環(huán)和纏結(jié)的區(qū)域,最終用Canu的consensus模塊得出最終結(jié)果。

所以,如果你想最大限度地發(fā)揮verkko的能力,首先你得有PacBio HiFi reads和ONT數(shù)據(jù)(也許還得是ultra long ONT才行)。

作為一個非常state-of-art的軟件,verkko當(dāng)然也是支持在大型集群上運(yùn)行的,不管是SGE, Slurm 還是LSF的作業(yè)系統(tǒng)它都是支持滴~ 另外,verkko還支持trio-based phasing ,不過要先用rukkimerqury這兩個軟件先處理后才能輸入給verkko。

軟件安裝

讓我們再次感謝conda的方便~

conda install -c conda-forge -c bioconda -c defaults verkko

軟件運(yùn)行

由于我只有PacBio HiFi數(shù)據(jù),所以就跑個純hifi的試試水

verkko -d /path/to/verkko \
--hifi test1.hifi_reads.fastq.gz \
test2.hifi_reads.fastq.gz \
test3.hifi_reads.fastq.gz \
--no-correction \
--no-nano \
--threads 20 \
--local \
--local-memory 100 \
--local-cpus 20

可用資源

bioRxiv文章:https://www.biorxiv.org/content/10.1101/2022.06.24.497523v1
GitHub地址:https://github.com/marbl/verkko

一個無用的小知識

Verkko is Finnish for net, mesh and graph.

Verkko在芬蘭語中是網(wǎng)、網(wǎng)格和圖形的意思。

私貨時間

  1. 可以說verkko是一個所圖甚大的基因組組裝軟件,是標(biāo)準(zhǔn)的state-of-art technology
  2. 有錢真的可以為所欲為。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容