BUSCO 做基因組評價

Benchmarking Universal Single-Copy Orthologs (BUSCO)是用于評估基因組組裝和注釋的完整性的工具。在相近的物種之間總有一些保守的序列,而BUSCO就是使用這些保守序列與組裝的結果進行比對,鑒定組裝的結果是否包含這些序列,包含單條、多條還是部分或者不包含等等情況來給出結果。通過與已有單拷貝直系同源數據庫的比較,得到有多少比例的數據庫能夠有比對,比例越高代表基因組完整度越好。


方法一:指定數據庫

#選擇數據庫
busco --list-datasets

#  使用不同數據庫進行 BUSCO 分析
busco -m prot -i pep.fasta -o viridiplantae_odb10 -l viridiplantae_odb10 -c 4

會生成busco_downloads文件夾

方法二:自動選擇數據庫

# 使用不同數據庫進行 BUSCO 分析
busco -m prot -i Sind.pep.fasta -o auto-lineage-euk --auto-lineage-euk -c 4 
  • 統(tǒng)計結果


畫圖

將結果都放在一個新建的result文件夾里

generate_plot.py -wd result

BUSCO安裝比較復雜 推薦使用conda或者singularity容器

歡迎關注Bioinfor生信云!

?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容