論文
Plastid Genome Assembly Using Long-read data
https://onlinelibrary.wiley.com/doi/epdf/10.1111/1755-0998.13787
還有一篇對(duì)應(yīng)的論文
https://www.biorxiv.org/content/10.1101/2023.06.27.546741v1.full.pdf
Phylogenetic placement of Ceratophyllum submersum based on a complete plastome sequence derived from nanopore long read sequencing data
對(duì)應(yīng)的github主頁
https://github.com/Bean061/ptgaul
軟件直接用conda安裝就可以
使用也非常簡單
ptGAUL.sh -r /path/Beta.fasta -l ont.fq -t 8 -f 3000 -o ./ptgaul/
需要指定一個(gè)參考序列,github主頁上寫到這個(gè)參考序列來自同屬或者同科的葉綠體基因組序列都可以
軟件運(yùn)行非???,基本上10分鐘就能拿到組裝結(jié)果,手頭有數(shù)據(jù)的可以試試
這個(gè)流程首先使用minimap2將ont數(shù)據(jù)比對(duì)到參考的葉綠體基因組,然后生成paf文件,然后根據(jù)paf文件去過濾比對(duì)上的reads,然后選取50X的reads去組裝,組裝用到的軟件是flye,我試了一下我自己手頭的數(shù)據(jù),初次比對(duì)然后過濾比對(duì)到參考基因組序列的reads大約都在1000X左右,我自己手頭的ont數(shù)據(jù)文庫長度應(yīng)該是在20k左右,之前記得ont的8k文庫好像很便宜了,不知道用8k文庫的數(shù)據(jù)來組裝葉綠體基因組效果怎么樣
學(xué)習(xí)一下這個(gè)流程的代碼,主要學(xué)習(xí)怎么根據(jù)paf格式的文件提取比對(duì)到的reads
推文記錄的是自己的學(xué)習(xí)筆記,很可能存在錯(cuò)誤,請(qǐng)大家批判著看