Benchmarking Universal Single-Copy Orthologs (BUSCO)是用于評(píng)估基因組組裝和注釋的完整性的工具。在相近的物種之間總有一些保守的序列,而BUSCO就是使用這些保守序列與組裝的結(jié)果進(jìn)行比對(duì),鑒定組裝的結(jié)果是否包含這些序列,包含單條、多條還是部分或者不包含等等情況來給出結(jié)果。通過與已有單拷貝直系同源數(shù)據(jù)庫(kù)的比較,得到有多少比例的數(shù)據(jù)庫(kù)能夠有比對(duì),比例越高代表基因組完整度越好。

方法一:指定數(shù)據(jù)庫(kù)
#選擇數(shù)據(jù)庫(kù)
busco --list-datasets
# 使用不同數(shù)據(jù)庫(kù)進(jìn)行 BUSCO 分析
busco -m prot -i pep.fasta -o viridiplantae_odb10 -l viridiplantae_odb10 -c 4
會(huì)生成busco_downloads文件夾
方法二:自動(dòng)選擇數(shù)據(jù)庫(kù)
# 使用不同數(shù)據(jù)庫(kù)進(jìn)行 BUSCO 分析
busco -m prot -i Sind.pep.fasta -o auto-lineage-euk --auto-lineage-euk -c 4
-
統(tǒng)計(jì)結(jié)果
畫圖
將結(jié)果都放在一個(gè)新建的result文件夾里
generate_plot.py -wd result

