男人天堂成人网,在线色女av,色色综合资源

最近拿到了nanopore的數(shù)據(jù)，嘗試對(duì)其組裝。目前用的是Canu，預(yù)計(jì)2個(gè)月內(nèi)才能走完第一波分析，速度實(shí)在感人，所以翻了翻文獻(xiàn)，找找組裝方法。

目前Nanopore賣點(diǎn)主要是兩個(gè)角度：第一是Nanopore的讀長(zhǎng)長(zhǎng)，某些情況下能夠達(dá)到單條上M，但是這種情況可遇而不可求，很多時(shí)候只存在于宣傳冊(cè)上。另一個(gè)則是Nanpore便宜，這樣就能夠保證測(cè)序深度，從而提高組裝質(zhì)量。

但是Nanopore也有一個(gè)劣勢(shì)，那就是它的錯(cuò)誤譜(error profile)和PacBio不一樣，并非隨機(jī)，而是主要集中在homopolymer。因此PacBio在糾錯(cuò)之后的準(zhǔn)確率可以高達(dá)99%，但是Nanopore達(dá)不到該水平。這個(gè)問題就導(dǎo)致了Nanopore在組裝時(shí)候會(huì)消耗更多的計(jì)算資源。比如說Canu在文檔里提到，它將Nanopore糾錯(cuò)后的錯(cuò)誤率從原來的0.144下調(diào)到0.12，速度提高了5-10倍。

Decrease the default maximum error rate allowed when finding overlaps in corrected Nanopore reads from 14.4% to 12.0%. With the over-occurring kmer changes mentioned previously, run times for finding overlaps in Nanopore reads should decrease by 5 to 10 fold.

PacBio的糾錯(cuò)后錯(cuò)誤率默認(rèn)設(shè)置是0.045，那么相對(duì)速度可能就是Nanopore的30倍。換句話說，同樣的數(shù)據(jù)量，PacBio裝1天，可能Nanopore就要一個(gè)月。很多基因組大一點(diǎn)，根本就不敢用Canu。

We also tried to use Canu⁴¹ but could not get to the final assembly stage owing to the high computational requirements.

這里總結(jié)下我看文獻(xiàn)找到的一些組裝策略，一般我們可以都嘗試下，然后選擇結(jié)果參數(shù)最好的作為最終版本

方案1: 不糾錯(cuò)直接組裝。輸入數(shù)據(jù)分為兩種情況，一種是用所有的原始數(shù)據(jù)（包括長(zhǎng)度過濾2K/5K以下），一種則是選擇最長(zhǎng)的30X, 40X作為輸入。

miniasm: https://github.com/lh3/miniasm
WTDBG2: https://github.com/ruanjue/wtdbg2
SMARTdenovo: https://github.com/ruanjue/smartdenovo
~~RA: https://github.com/lbcb-sci/ra~~，個(gè)人對(duì)這個(gè)工具極其失望，運(yùn)行速度慢，內(nèi)存管理差，中斷之后會(huì)刪除所有中間文件。
Flye: - https://github.com/fenderglass/Flye
注: 不糾錯(cuò)直接組裝得到的contig，需要先進(jìn)行三代自糾錯(cuò)，才能用二代糾錯(cuò)，否則比對(duì)率會(huì)比較低。

方案2: 糾錯(cuò)后組裝，然后挑選所有數(shù)據(jù)或者最長(zhǎng)的30X, 40X作為輸入?？晒┻x擇的糾錯(cuò)工具如下

NextDenovo: https://github.com/Nextomics/NextDenovo
Canu: https://github.com/marbl/canu
MECAT: https://github.com/xiaochuanle/MECAT
NECAT: https://github.com/xiaochuanle/NECAT

注: NECAT, Canu可以從頭跑到尾，其中NECAT是MECAT的繼任者，專門處理Nanopore組裝。

由于Canu的參數(shù)選擇會(huì)明顯的影響到運(yùn)行速度，因此在Canu官方FAQ里對(duì)不同Nanopore版本參數(shù)組裝進(jìn)行了介紹

Nanopore R7 1D和低相似度reads: 這種數(shù)據(jù)目前已經(jīng)不存在了，所以不在此處討論。
Nanopore R7 2D和 Nanopore R9 1D: 如果數(shù)據(jù)覆蓋度和錯(cuò)誤率比較高的話，需要調(diào)整參數(shù)overlapper=mhap utgReAlign=true. 對(duì)于大基因組會(huì)降低連續(xù)性。
Nanopore R9 2D: 調(diào)整糾錯(cuò)后的錯(cuò)誤率. correctedErrorRate=0.105
Nanopore R9.4: 這應(yīng)該是目前公司的交付結(jié)果，原始數(shù)據(jù)錯(cuò)誤已經(jīng)有很高提升，糾錯(cuò)后的錯(cuò)誤率也比較低。如果基因組的覆蓋度超過30X，那么設(shè)置如下參數(shù)corMhapOptions=--threshold 0.8 --ordered-sketch-size 1000 --ordered-kmer-size 14' correctedErrorRate=0.105 可以提高運(yùn)行速度。

Nanopore不同平臺(tái)的試劑

由于現(xiàn)在的三代測(cè)序價(jià)格低了，因此之前那種低深度測(cè)序，然后用二代進(jìn)行raw read糾錯(cuò)的方法，或者混合組裝的方法，就不討論了。

歡迎在評(píng)論區(qū)補(bǔ)充工具

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

Nanopore測(cè)序的基因組組裝策略

Nanopore測(cè)序的基因組組裝策略

參考資料

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

Nanopore測(cè)序的基因組組裝策略

參考資料

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av