flanking sequence for candidate SNPs

  1. 得到了cadidate SNPs list

Scaffold861: 64225
Scaffold44:1265163
Scaffold121: 842037
Scaffold225: 196363
Scaffold266: 463359
Scaffold68: 899972
...

  1. 獲取vcf文件
file=338cand.snps
sed -i 's/\t/:/g' $file
sed -i 's/ /:/g' $file
sed -i 's/:::/:/g' $file
sed -i 's/::/:/g' $file
sed -i 's/:/\t/g' $file
zgrep -F -f  $file gatk4.SNP_VF_SV.vcf.gz > 338cands_no_header.vcf
bcftools view -h gatk4.SNP_VF_SV.vcf.gz > header
cat header 338cands_no_header.vcf > 338cands.vcf

bcftools view -H 338cands.vcf|wc -l
grep -v "#" 338cands.vcf|grep Scaffold|wc -l

檢查數(shù)目是否一致

SNP注釋

DIR=/home/mmcui/poolseq/gatk_hard_filtering/howto_filter
VCF=338cands
java -Xmx4g -jar  ~/annotation/snpEff/snpEff.jar -v Agla_Btl03082013 $DIR/$VCF.vcf > $VCF.ann.vcf
上下游1000bp序列.png

Scaffold1:1235332-1237332
Scaffold1:4378505-4380505
Scaffold1:4078202-4080202
Scaffold1:1639666-1641666
Scaffold1:1555820-1557820

retrieve flanking region

while read line
do 
samtools faidx 210Scaffolds.fasta $line >>flanking_sequences.snps
done < 337snps.positions
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 一、簡介 Samtools是一個用于操作sam和bam格式文件的應用程序集合,具有眾多的功能。 它從SAM(序列比...
    Davey1220閱讀 21,882評論 2 34
  • Part 3 Samtools view view命令的主要功能是:將sam文件轉換成bam文件;然后對bam文件...
    _linun_閱讀 500評論 0 2
  • samtools的說明文檔:http://samtools.sourceforge.net/samtools.sh...
    YX_Andrew閱讀 612評論 0 2
  • samtools的說明文檔:http://samtools.sourceforge.net/samtools.sh...
    曉僉閱讀 13,517評論 0 6
  • 我是黑夜里大雨紛飛的人啊 1 “又到一年六月,有人笑有人哭,有人歡樂有人憂愁,有人驚喜有人失落,有的覺得收獲滿滿有...
    陌忘宇閱讀 8,870評論 28 54

友情鏈接更多精彩內容