使用VEP對植物進(jìn)行基因注釋

前兩天使用snpeff進(jìn)行基因注釋,結(jié)果發(fā)現(xiàn)不少錯誤,所以就是用vep來進(jìn)行注釋,同樣的位點(diǎn),發(fā)現(xiàn)vep的注釋是對的。

下面是使用筆記。

首先去官網(wǎng)上下載安裝包

現(xiàn)在的版本是98(動物),45(植物),如果下載安裝包后里面沒有INSTALL.pl那就可能是版本更新了(19.11.29)
mkdir vep && cd vep
wget -c https://github.com/Ensembl/ensembl-tools/archive/release/97.zip
unzip 97.zip
cd ensembl-vep-release-97
  • 在安裝之前先修改cache的地址,就是將INSTALL.pl中209行得地址進(jìn)行修改,動物的版本植物的版本不一樣 ,我又不知道怎么使用默認(rèn)的$DATA_VERSION隨著植物的版本更新而更新,所以就直接使用了現(xiàn)在最新的版本編號(同樣如果需要下載fasta序列的話也可以進(jìn)行修改)。
vi INSTALL.pl
image

修改過后進(jìn)行安裝

perl INSTALL.pl -c ~/reference/vep/
#有時候會報錯,可以使用下面的命令
#perl INSTALL.pl -c ~/ngs/reference/vep/ --NO_HTSLIB
  • 安裝程序,-c 后面是你下載cache的位置,默認(rèn)是$HOME/.vep,安裝過程中需要安裝API文件,比較費(fèi)時間,可能需要安裝幾次才能安裝上。然后就是下載cache文件,選擇自己物種的編號進(jìn)行下載,以玉米為例
image

但是有時需要安裝一些模塊

cpanm DBI
cpanm DBD::mysql

然后將cpanm的安裝目錄添加到環(huán)境變量中去,或者在INSTALL.pl的文件中添加一行
BEGIN { unshift @INC, '/home/free22/perl5/lib/perl5/x86_64-linux-thread-multi' }

安裝好了就可以進(jìn)行使用了

~/biosoft/vep --fasta~/reference/Zea_mays.AGPv4.dna.toplevel.fa --offline --species zea_mays--cache_version 39 --dir_cache ~/reference/vep/ -i maize_file.vcf -o maize_file_vep_annotate.vcf
  • 對變異進(jìn)行注釋,--species 指明物種,--cache_version指明cache的版本號,一些詳細(xì)的參數(shù)去官網(wǎng)上查看。

  • 而對于變異類型的解釋,也可以查看詳細(xì)的說明。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容