首先非常感謝Cj大神開發(fā)出來的TBtools生信工具,為生信分析做圖帶來了極大的便利。作為生信小白,在做多物種間共線性分析時(shí),嘗試了多種方法,苦于沒有計(jì)算機(jī)基礎(chǔ),一直沒能完成,最后鎖定TBtools的零命令行作圖,幾經(jīng)摸索,終于成功,賊開心。

話不多說先上效果圖
一、準(zhǔn)備工作
1.下載各個物種的.gff文件和基因組序列文件

示例
數(shù)據(jù)下載地址:[http://plants.ensembl.org/info/website/ftp/index.html]

1

2:右擊,復(fù)制鏈接,用迅雷下載比較快

3
2.工具TBtools:歡迎加入開發(fā)作者的QQ交流學(xué)習(xí)群(553679029),先看群公告哈。
二、將文件進(jìn)行ID prefix,統(tǒng)一染色體名稱。

沒統(tǒng)一的草圖,染色體前綴由系統(tǒng)命名
打開TBtools

1gff文件進(jìn)行ID prefix

2

3.fa文件進(jìn)行ID prefix

4:注意兩次輸入的字符必須一樣。例圖中是:AT-
按步驟操作完成后,每個物種得到新的.gff文件和.fa文件,用于后續(xù)的共線性分析。
三、確定物種間的親緣遠(yuǎn)近關(guān)系
目的:給各個物種安排的排序位置,例如我做的5個物種擬南芥、大豆、水稻、小麥和玉米,其中水稻、小麥和玉米屬于禾本科植物,這三個物種之間的共線性關(guān)系自然是比較好的,但是具體的怎末連線還是不清楚,當(dāng)然可以通過文獻(xiàn)查找來確定,這里為了保險(xiǎn)起見,我決定將所有物種兩兩組合,看共線性關(guān)系,先做兩物種間共線性,再來排列。
兩個物種間的共線性,請參考:http://www.itdecent.cn/p/6c5a5a2d8fa7
注意:
1:OnestepMCscanX的比對時(shí)間因物種而已,比如小麥這種超大基因組的物種,我用小筆記本跑了兩天,start后就靜靜等待了,建議最好多用幾臺電腦。
2:兩物間共線性分析時(shí),用ID prefix后的文件,只是鏈接里我用的原始文件。

按照高亮基因共線性條目多少進(jìn)行排序(水稻做了秈稻和粳稻的可以忽視,5個物種也就10種組合)
結(jié)果:確定這幾個物種的前后順序?yàn)閿M南芥、大豆、水稻、小麥、玉米,得到兩兩之間的比對結(jié)果文件。
四、比對文件合并與修改

多物種共線性需要用到的文件

1

2

3:所需文件合并結(jié)果

4:查看合并文件,將文件拖入即可

5:將碎片刪除,將染色體保留并排序

6:表示圖片顏色的數(shù)字可以刪除

7:整理自己的Highlight基因ID,依舊是全英狀態(tài)下輸入

8:可視化啦

9:最終圖片

10:我將顏色數(shù)字代碼去除的亞子