從vcf文件提取exon中的snp和Indel

首先制作bed格式的文件包含基因組全部的外顯子區(qū)域坐標(biāo)如下:

#download gff3 file
wget -c http://rice.plantbiology.msu.edu/pub/data/Eukaryotic_Projects/o_sativa/annotation_dbs/pseudomolecules/version_7.0/all.dir/all.gff3

cmd:perl -alne '{print if $F[2] eq "exon"}' all.gff3 |cut -f 1,3,4 > exon.bed
$head exon.pos
Chr1    2903    3268
Chr1    3354    3616
Chr1    4357    4455
Chr1    5457    5560
Chr1    7136    7944
Chr1    8028    8150
Chr1    8232    8320
Chr1    8408    8608
Chr1    9210    9617
Chr1    10104   10187

從vcf文件中提取位于exon區(qū)域的變異位點(diǎn)

cat sample.vcf | java -jar ~/biosoft/new-snpEff/snpEff/SnpSift.jar intervals /disk3/name/MSU/gff/exon.pos >exon.vcf

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容