零基礎(chǔ)多物種間共線性分析

首先非常感謝Cj大神開發(fā)出來的TBtools生信工具,為生信分析做圖帶來了極大的便利。作為生信小白,在做多物種間共線性分析時(shí),嘗試了多種方法,苦于沒有計(jì)算機(jī)基礎(chǔ),一直沒能完成,最后鎖定TBtools的零命令行作圖,幾經(jīng)摸索,終于成功,賊開心。

話不多說先上效果圖

一、準(zhǔn)備工作

1.下載各個物種的.gff文件和基因組序列文件


示例

數(shù)據(jù)下載地址:[http://plants.ensembl.org/info/website/ftp/index.html]

1

2:右擊,復(fù)制鏈接,用迅雷下載比較快

3

2.工具TBtools:歡迎加入開發(fā)作者的QQ交流學(xué)習(xí)群(553679029),先看群公告哈。

二、將文件進(jìn)行ID prefix,統(tǒng)一染色體名稱。

沒統(tǒng)一的草圖,染色體前綴由系統(tǒng)命名

打開TBtools

1gff文件進(jìn)行ID prefix

2

3.fa文件進(jìn)行ID prefix

4:注意兩次輸入的字符必須一樣。例圖中是:AT-
按步驟操作完成后,每個物種得到新的.gff文件和.fa文件,用于后續(xù)的共線性分析。

三、確定物種間的親緣遠(yuǎn)近關(guān)系

目的:給各個物種安排的排序位置,例如我做的5個物種擬南芥、大豆、水稻、小麥和玉米,其中水稻、小麥和玉米屬于禾本科植物,這三個物種之間的共線性關(guān)系自然是比較好的,但是具體的怎末連線還是不清楚,當(dāng)然可以通過文獻(xiàn)查找來確定,這里為了保險(xiǎn)起見,我決定將所有物種兩兩組合,看共線性關(guān)系,先做兩物種間共線性,再來排列。

兩個物種間的共線性,請參考:http://www.itdecent.cn/p/6c5a5a2d8fa7

注意:
1:OnestepMCscanX的比對時(shí)間因物種而已,比如小麥這種超大基因組的物種,我用小筆記本跑了兩天,start后就靜靜等待了,建議最好多用幾臺電腦。
2:兩物間共線性分析時(shí),用ID prefix后的文件,只是鏈接里我用的原始文件。

按照高亮基因共線性條目多少進(jìn)行排序(水稻做了秈稻和粳稻的可以忽視,5個物種也就10種組合)

結(jié)果:確定這幾個物種的前后順序?yàn)閿M南芥、大豆、水稻、小麥、玉米,得到兩兩之間的比對結(jié)果文件。

四、比對文件合并與修改

多物種共線性需要用到的文件
1

2

3:所需文件合并結(jié)果

4:查看合并文件,將文件拖入即可

5:將碎片刪除,將染色體保留并排序

6:表示圖片顏色的數(shù)字可以刪除

7:整理自己的Highlight基因ID,依舊是全英狀態(tài)下輸入

8:可視化啦

9:最終圖片

10:我將顏色數(shù)字代碼去除的亞子

完結(jié)撒花,最費(fèi)時(shí)間的還是兩物種間比對找遠(yuǎn)近關(guān)系,只要按照步驟來,很快就可以做出來的,加油!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容