2022-04-14兩個基因組間鑒定結果SV和SNP變異

###01.序列比對

nohup nucmer --mum -c 100 -l 50 -g 1000 -t 12 $ref $qry &> step1.log &

#--mincluster/-c 用于聚類的匹配最低長度,默認65

#--minmatch/-l 單個匹配最小長度

#--maxgap/-g: 兩個相鄰匹配間的最大gap長度,默認90

---------------------------------------------------------------------------------------

--mum?Use anchor matches that are unique in both the reference and query 或者?--maxmatch Use all anchor matches regardless of their uniqueness

同時比對也可以用minimap2等軟件完成

--------------------------------------------------------------------------------------

###02.去除短的和低質量比對

delta-filter -1 -q -r -i 89 -l 50 out.delta > out.filter

#-1: 1對1聯(lián)配,允許重排,是-r和-q的交集

#-q: 僅保留每個query在reference上的最佳位置,允許多條query在reference上重疊

#-r: 僅保留每個reference在query上的最佳位置,允許多條reference在query上重疊

##-i: 最小的相似度 [0,100], 默認0

##-l: 最小的匹配長度 默認0.

#-u: 最小的聯(lián)配唯一度 [0,100], 默認0

#-o: 最大重疊度,針對-r和-q設置。 [0,100], 默認100

#-g: 1對1全局匹配,不允許重排

#-m: 多對對聯(lián)配,允許重排,是-r和-q的合集

###03.比對結果轉成表格格式

show-coords -THrd out.filter > out.filter.coords

#-r:以refID排序,相對的,還有-q,以queryID排序

#-T: Switch output to tab-delimited format

#-H: Do not print the output header

#-d 在附加的 FROM 列中顯示對齊方向(引物的默認值)

###04.運行syri進行變異檢測

syri -c out.filter.coords -d out.filter -r $ref -q $qry

# 輸入mummer coords文件,記錄共線性塊位置信息

# 輸入mummer delta文件,記錄共線性區(qū)塊內(nèi)錯配,插入,刪除等信息;即SNP和indel信息。

# refence路徑

# query路徑

###05.繪圖

syri plotsr syri.out $ref $qry -H 8 -W 5

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容