跟著MER學(xué)數(shù)據(jù)分析:利用ont三代測序數(shù)據(jù)組裝植物葉綠體基因組

論文

Plastid Genome Assembly Using Long-read data

https://onlinelibrary.wiley.com/doi/epdf/10.1111/1755-0998.13787

還有一篇對(duì)應(yīng)的論文

https://www.biorxiv.org/content/10.1101/2023.06.27.546741v1.full.pdf

Phylogenetic placement of Ceratophyllum submersum based on a complete plastome sequence derived from nanopore long read sequencing data

對(duì)應(yīng)的github主頁

https://github.com/Bean061/ptgaul

軟件直接用conda安裝就可以

使用也非常簡單

ptGAUL.sh -r /path/Beta.fasta -l ont.fq -t 8 -f 3000 -o ./ptgaul/

需要指定一個(gè)參考序列,github主頁上寫到這個(gè)參考序列來自同屬或者同科的葉綠體基因組序列都可以

軟件運(yùn)行非???,基本上10分鐘就能拿到組裝結(jié)果,手頭有數(shù)據(jù)的可以試試

這個(gè)流程首先使用minimap2將ont數(shù)據(jù)比對(duì)到參考的葉綠體基因組,然后生成paf文件,然后根據(jù)paf文件去過濾比對(duì)上的reads,然后選取50X的reads去組裝,組裝用到的軟件是flye,我試了一下我自己手頭的數(shù)據(jù),初次比對(duì)然后過濾比對(duì)到參考基因組序列的reads大約都在1000X左右,我自己手頭的ont數(shù)據(jù)文庫長度應(yīng)該是在20k左右,之前記得ont的8k文庫好像很便宜了,不知道用8k文庫的數(shù)據(jù)來組裝葉綠體基因組效果怎么樣

學(xué)習(xí)一下這個(gè)流程的代碼,主要學(xué)習(xí)怎么根據(jù)paf格式的文件提取比對(duì)到的reads

推文記錄的是自己的學(xué)習(xí)筆記,很可能存在錯(cuò)誤,請(qǐng)大家批判著看

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容