一. 簡(jiǎn)介
MCScanX是由福建農(nóng)林大學(xué)唐海寶老師參與開(kāi)發(fā)的基因組共線性分析軟件,發(fā)表至今引用數(shù)200以上,相關(guān)概念和算法參考文獻(xiàn)如下:
- Tang H, Bowers J E, Wang X, et al. Synteny and Collinearity in Plant Genomes[J]. Science, 2008, 320(5875):486-488.
- Wang Y, Tang H, DeBarry JD, Tan X, Li J, Wang X, Lee TH, Jin H, Marler B, Guo H, Kissinger JC, Paterson AH. (2012) MCScanX: a toolkit for detection and evolutionary analysis of gene synteny and collinearity. Nucleic Acids Res, 40(7): e49.
二. 軟件安裝和序列比對(duì)
氨基酸多序列比對(duì)軟件建議用diamond(速度極快):
(py27) [abc@Server MCscan]$ conda install -c bioconda diamond #conda 安裝簡(jiǎn)單方便
以a, b和c三個(gè)基因組共線性分析為例:
(py27) [abc@Server MCscan]$ cat a.pep b.pep c.pep >abc.pep #合并三個(gè)基因組的蛋白序列文件
(py27) [abc@Server MCscan]$ diamond makedb --in abc.pep -d abc #建立索引文件
(py27) [abc@Server MCscan]$ diamond blastp -d abc -q abc.pep -o abc.blast -e 1e-5 -k 5 #abc.blast包括a,b,c相互比對(duì),以及和自身的比對(duì)結(jié)果,即:ab,ba,bc, aa, bb...,比對(duì)取分?jǐn)?shù)最高的5個(gè)結(jié)果
三. MCscanX分析
MCscanX分析,可以通過(guò)命令行完成,這里推薦一種較簡(jiǎn)單的方法,使用陳程杰老師開(kāi)發(fā)的TBtools軟件完成:
首先,利用File Merge For MCScanX將基因組a, b和c的gff3文件合并生成簡(jiǎn)化gff文件:

File Merge For MCScanX.png
輸入:a.gff3, b.gff3, c.gff3; 輸出:abc.gff; 合并方式:GtfGff2SimGxf。
MCscanX分析利用Quick Run MCSanX Wrapper,界面如下:

Quick Run MCSanX Wrapper.png
輸入:abc.blast,abc.gff ;輸出:abc.collinearity等;
四. 利用TBtools的Multiple Synteny Plot作圖;
操作界面如下:

Multiple Synteny Plot.png
準(zhǔn)備輸入文件:
- abc.layout格式如下(可以根據(jù)需要靈活調(diào)整布局):
A:228,26,28:LG01 LG02 LG03 ...
B:255,217,47:Chromosome01 Chromosome02 Chromosome03 ...
C:56,108,176:Chr01 Chr02 Chr03 ...
前面生成的abc.gff文件;
abc.link,利用File Merge For MCScanX生成:
輸入:abc.collinearity; 輸出:abc.link; 合并方式:Collinear;
- abc.highlight格式如:Gene\tRvalue,Gvalue,Bvalue(08G117800 55,126,184);
輸出圖片如下:

Multiple Synteny Plot.png
可以通過(guò)調(diào)整 abc.layout文件只顯示部分染色體:

Multiple Synteny Plot.png