劉總的項目歷經千辛萬苦終于要開始了,因為測了一個基因組,當然不可避免的要做一個Circos圖展現基因組的一些信息。今我就來記錄一下Circos圖繪制的方法,具體原理細節(jié)老規(guī)矩不介紹,腳本不外傳,方法僅供參考。讓我們快來開始吧,快來開始吧。
簡單看一下我們想要的Circos圖長啥樣:

Fonio millet genome unlocks African orphan crop
diversity for agriculture in a changing climate
大概就這樣,每一圈代表一種信息。
現在就開始我們自己的圖片繪制吧。
首先準備輸入文件
xxx.cds
xxx.gff
xxx.fa
先做最內圈的共線性,用jcvi做
#只截取gff中大片段的LG信息(組裝的時候還有很多contig,影響畫圖)
grep "^LG" Fsr.genome.gff > f.gff
#將gff轉為bed格式
python -m jcvi.formats.gff bed --type=mRNA f.gff -o f.bed
#鑒定共線性區(qū)塊(f.cds f.bed在當前目錄下)
python -m jcvi.compara.catalog ortholog f f --no_strip_names
#得到我們需要的輸出文件 f.f.anchors f.bed
之后我們就該做circos了,目前打算繪制基因個數,重復序列含量,GC含量,就這些吧,需要再添加好了。
具體的步驟如下:(因為一些原因具體代碼不方便透露,有需要私聊哈,視情況而定)
#計算染色體長度
#生成染色體文件 7列
#生成窗口文件, 窗口大小50Kb
#計算每個窗口平均GC含量
#計算每個窗口基因條數
#計算每個窗口重復序列含量
#共線性模塊鑒定
所有的Circos輸入文件就準備好了,除了輸入呢,還有幾個配置文件,根據需求和其他教程自己配置哈,這里不聊了。
最后運行Circos
circos -conf f.conf
要得到一個漂亮的圖還是需要不斷調試的。