1. Mummer詳細(xì)介紹轉(zhuǎn)至參考:
http://www.itdecent.cn/p/2e184e5c15b7
http://www.itdecent.cn/p/c12f2a117892
https://wenku.baidu.com/view/ba1f0dd452d380eb63946d3e.html?fr=search-1-wk_es_paddle-income1-psrec1&fixfr=JLOnLdSq1hacvZk313XCkA%3D%3D
2.Mummer下載地址
最新版本2020:Mummer 4.0.0 release candidate 1 Latest
github地址:https://github.com/mummer4/mummer
sourceforge下載: http://mummer.sourceforge.net/
3.什么是共線性?
移步至:http://www.itdecent.cn/p/da5922df19d1
4.共線性有什么用?
此處只展示基因組共線性常用的需求:
我們做項(xiàng)目一般是做基因組共線性,根據(jù)近緣物種的染色體編號(hào)調(diào)整我們正在做的基因組r染色體編號(hào)。如果沒(méi)有已發(fā)表的物種,則從大到小排列。
基因共線性則是作cicos圖,jcvi等作圖,物種內(nèi)或者物種中間進(jìn)行比較。
繼續(xù)整理中:
5.基因組共線性怎么做?
5.1 Mummer軟件安裝
$ wget -c -t 0 https://github.com/mummer4/mummer/releases/download/v4.0.0rc1/mummer-4.0.0rc1.tar.gz
$ tar -xvzf mummer-4.0.0rc1.tar.gz
$ current_path='pwd'
$ cd mummer-4.0.0rc1
$ ./configure --prefix=`pwd`
$ make
# Add MUMmer tools to your PATH
$ export PATH=$current_path/mummer-4.0.0rc1:$PATH
5.2 Mummer比對(duì)畫圖:
5.2.1.比對(duì):nucmer關(guān)注序列的相似之處,所以它允許重排,倒置和重復(fù)現(xiàn)象
export PATH=/share/nas1/pengzw/software/mummer-4.0.0rc1:$PATH
nucmer -t 50 --mum --prefix=ref_qry A.genome.fa B.genome.fa >ref_qry.delta
# A為ref基因組
delta-filter -i 90 -l 10000 -q ref_qry.delta >ref_qry.delta.filter
#-l 表示過(guò)濾
# -i 表示相似度,可以根據(jù)情況調(diào)整,讓圖片看起來(lái)不那么亂
mummerplot --png -p 10k ref_qry.delta.filter
# -p 輸出文件前綴
可以生成pdf圖片
convert -quality 200 -density 400 10k.png 10k.pdf #方法1:直接 convert轉(zhuǎn)換
mummerplot -p 10k ref_qry.delta.filter -t postscript
ps2pdf 10k.ps 10k.pdf #方法2,但是圖片效果會(huì)跟png有出入
參數(shù)詳解
nucmer 默認(rèn)是ref是唯一,加上 --mum ref和query都是唯一的。
delta-filter
-l 表示過(guò)濾
-i 表示相似度,可以根據(jù)情況調(diào)整,讓圖片看起來(lái)不那么亂
5.2.3 Mummer的mummerplot功能畫圖,參數(shù)詳解:
參考命令
nucmer -t 50 --mum --prefix=ref_qry A.genome.fa B.genome.fa >ref_qry.delta
# a為ref基因組,A.genome.fa為基因組所有序列,A中fa序排列順序指定了圖片上的輸出順序,可以根據(jù)需求更改。
delta-filter -i 90 -l 10000 -q ref_qry.delta >ref_qry.delta.filter
mummerplot --png -p test ref_qry.delta.filter -R A.genome.Chr.fa -Q B.genome.Chr.fa
#A.genome.Chr.fa 只有染色體序列 (我最近學(xué)習(xí)的展示方式)
mummerplot --png -p test ref_qry.delta.filter -R r.rfile -Q q.qfile
mummerplot 參數(shù)說(shuō)明:
-p 輸出文件前綴
--filter 保留最佳比對(duì),1對(duì)1,見下圖更好辨別
--small 默認(rèn)輸出參數(shù)
--large 圖片上字體和點(diǎn)更小
--png 參數(shù)里面沒(méi)看見,但是不用這需要調(diào)用X11。。。。迷惑中
-x|xrange 指定范圍
-y|yrange
-R ref畫圖順序文件,可以給r.file或者調(diào)整好想要順序的fa
-Q query畫圖順序文件,可以給q.file或者調(diào)整好想要順序的fa
我經(jīng)常忘記只保留染色體部分進(jìn)行比對(duì),最后圖片很丑,可以再比對(duì)后過(guò)濾保留染色體,再畫圖。
一般基因組開頭幾個(gè)都是染色體序列,按照順序排列,但是也有個(gè)別不是這個(gè)套路。。。圖中最終的染色體編號(hào)順序跟輸入fa里面的排列順序是一樣的。
5.2.4 調(diào)整畫圖順序
如果比對(duì)完,畫圖順序很亂,想搶救一下,有兩種方法:
1.下面**mummerplot那里-R -Q 給一個(gè)VS.txt文件,r.file,q.file **(包含序列id,長(zhǎng)度和方向)(推薦方法)。
2.下面mummerplot那里-R -Q 里面格式化排列輸出fa就可以。
1. -R -Q :比對(duì)后調(diào)整fa里面的順序,類似于這種提取格式化序列。
grep Chr Lachesis_assembly_changed.fa.fai|cut -f1 >id
cat Chr.id |perl -lane ' print "echo ${_} >${_}.id"'|sh
cat Chr.id | perl -lane ' print " perl /share/nas1/pengzw/script/tools/abstract_fasta_seq_by_id.v1.1.pl -i ${_}.id -fa Lachesis_assembly_changed.fa -o ${_}.fa "'|sh
2. -R -Q VS文件寫法(推薦方法):
#如果ref和query的不確定方向直接都寫+,即原始文件中的方向。
grep A.fa.fai |cut -f1,2 |awk '{print $1"\t"$2"\t+"}' >r.file
cat r.file
Chr01 1000000 +
Chr02 2000000 +
#如果確定ref和query的某些染色體的對(duì)應(yīng)方向,可以寫-,此時(shí)再畫圖,圖片上回顯示-的id有一個(gè)*號(hào)。
grep B.fa.fai |cut -f1,2 |awk '{print $1"\t"$2"\t+"}' >q.file
cat q.file ##手動(dòng)修改-的染色體
LG01 1000000 +
LG02 2000000 -

:
一般而言橫坐標(biāo)放的是ref,縱坐標(biāo)是query,不要給反了。
最后圖片呈現(xiàn)“/”表示與參考染色體方向一致,“\”表示方向相反。
不同參數(shù)的畫圖效果:
--small 默認(rèn)畫圖
--large 畫圖,字體和點(diǎn)線都變小了
--filter畫圖效果
ps2pdf 畫圖效果
mummerplot --png -p test out.delta.filter -R A.genome.Chr.fa -Q B.genome.Chr.fa
--small 默認(rèn)畫圖

--large 畫圖,字體和點(diǎn)線都變小了

--filter畫圖效果:

ps2pdf 畫圖效果:

6.以人類可讀方式具體的比對(duì)信息:
show-coords -r out.delta.filter> out.delta.filter.coord
-r 以refID排序
-q 以queryID排序
-l Include the sequence length information in the output
-c Include percent coverage information in the output