WGS分析用breakdancer找染色體結(jié)構(gòu)變異

結(jié)構(gòu)變異(structural variants,SV)
結(jié)構(gòu)變異類型:
通過pair-ends分析鑒定
---插入(Insertion)
---缺失(Deletion)
---缺失插入(Delegation and Insertion)
---反轉(zhuǎn)(Inversion)
.....

1. breakdancer軟件安裝

1.1 官網(wǎng)查看,只更新到2013年 breakdancer-1.1.2_2013_03_08.zip

1.2 conda 安裝

首先查查看conda中有沒有?

conda search breakdancer

WX20190722-110819@2x.png

conda install -y breakdancer
失敗了一次,又一次,

安裝失敗

再裝一次,就好了,conda的鏡像不穩(wěn)定
裝好了

2. 找SV

2.1 檢測insert
#-q INT Minimum mapping quality [35]
#-s Minimal mean insert size [50]
#-b INTNumber of bins in the histogram [50] 
#-g Output mapping flag distribution
mkdir SV && cd SV
bam2cfg.pl -g -h /home/huawei/raw_data/YSQ/4AL_resequence/output/bam/4AL_reseq.sorted.unique.markdup.add.bam >4AL_requence.cfg
運(yùn)行后出現(xiàn)的warning

一般來說我只關(guān)心報(bào)錯(cuò)error,warning什么的根本不管的,所以看一下生成了什么

ls
#4AL_requence.cfg
#4AL_reseq.sorted.unique.markdup.add.bam.lib1.insertsize_histogram
#4AL_reseq.sorted.unique.markdup.add.bam.lib1.insertsize_histogram.png

4AL_requence.cfg:測序平臺,樣本,讀長:150,indel總數(shù)量,最小值,最大值,平均indel長度,等


cfg信息

4AL_reseq.sorted.unique.markdup.add.bam.lib1.insertsize_histogram:插入片段的大小
4AL_reseq.sorted.unique.markdup.add.bam.lib1.insertsize_histogram.png生成的圖片顯示:插入片段的大小(橫坐標(biāo))及相應(yīng)的頻率(縱坐標(biāo))


查看插入片段大小生成的柱狀圖
2.2 檢測結(jié)構(gòu)變異
breakdancer-max -q 10  4AL_requence.cfg > 4AL_requence.ctx
#-o STRING operate on a single chromosome [all chromosome]
#-s INT minimum length of a region [7]
#-m INT maximum SV size [1000000000]
#-r INT minimum number of read pairs required to establish a connection -q INTminimum mapping quality
#輸出文件格式:
#Chr1  Pos1  Orientation1  Chr2  Pos2  Orientation2  Type  Size  Score  num_Reads  num_Reads_lib  4AL_reseq.sorted.unique.markdup.add.bam
#chr1A_part1    3363    28+25-  chr1A_part1 3475    28+25-  ITX -248    99  22  /home/huawei/raw_data/YSQ/4AL_resequence/output/bam/4AL_reseq.sorted.unique.markdup.add.bam|22  NA
#chr1A_part1    26809   6+3-    chr1A_part1 26916   6+3-    ITX -266    64  3   /home/huawei/raw_data/YSQ/4AL_resequence/output/bam/4AL_reseq.sorted.unique.markdup.add.bam|3   NA

1-3列和4-6列被用來指定兩個(gè)SV斷點(diǎn)的坐標(biāo)。
一列為染色體chr,一列為位置pos,一列為方向orientation,正負(fù)號代表reads比對到anchoring區(qū)域的方向,數(shù)字代表比對到這個(gè)位置的reads數(shù)目。
第7列表示SV的類型,
分別有:DEL (deletions), INS (insertion), INV (inversion), ITX (intra-chromosomal translocation,異位發(fā)生在同一條染色體內(nèi)), CTX (inter-chromosomal translocation,易位發(fā)生在兩條同源或非同源染色體之間), and Unknown.
第8列表示SV的大小,可以忽略正負(fù)號的意義,對染色體間易位無用。
第9列可信度得分。
第10列支持該SV的reads數(shù)目。
第11列,library中支持該SV的reads數(shù)目
第12列run parameter

生成SV

第七列為不同的SV類型,統(tǒng)計(jì)各種類型有多少,并分別輸出到不同的txt中。
cat 4AL_requence.cfg |grep 'DEL' >4AL_DEL.txt
cat 4AL_requence.cfg |grep 'INV' >4AL_INV.txt
cat 4AL_requence.cfg |grep 'ITX' >4AL_ITX.txt
cat 4AL_requence.cfg |grep 'CTX' >4AL_CTX.txt

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容