使用pfam-scan進(jìn)行預(yù)測

一、 安裝

  • 使用conda安裝Pfam_scan
$ conda create -n pfam_scan ##可新建一個(gè)環(huán)境,用于安裝pfam-scan
$ source activate pfam_scan
$ conda install pfam_scan

pfam_scan依賴bioperl,因此,通過conda安裝簡單快捷.

  • 安裝hmmer3 , 使用以下命令安裝:
$ wget http://eddylab.org/software/hmmer/hmmer-3.2.tar.gz
 $ tar -xzvf  hmmer-3.2.1.tar.gz
$ cd hmmer-3.2
$ ./configure
$ make
$ make check
$ make install 

# 添加至環(huán)境變量
vim ~/.bashrc

export PATH=/usr/local/bin:$PATH

# 環(huán)境變量立即生效
source ~/.bashrc

最新版的Pfam數(shù)據(jù)庫不再有Pfam-B了。

wget ftp://ftp.ebi.ac.uk:21/pub/databases/Pfam/current_release/Pfam-A.hmm.gz
wget ftp://ftp.ebi.ac.uk:21/pub/databases/Pfam/current_release/Pfam-A.hmm.dat.gz
wget ftp://ftp.ebi.ac.uk:21/pub/databases/Pfam/current_release/active_site.dat.gz
gunzip *.gz
  • 通過hmmerspress來把下載的數(shù)據(jù)建庫:
 $ hmmpress Pfam-A.hmm

二、軟件使用

參數(shù)說明:
 -dir :  Pfam_data_file_dir   包含Pfam數(shù)據(jù)文件的目錄[必須] 

-fasta :  fasta_file   包含序列的輸入文件名 [必須]

 -e_seq    序列E-value閾值 [不指定則使用默認(rèn)閾值] 

 -e_dom   結(jié)構(gòu)域E-value閾值 [不指定則使用默認(rèn)閾值]

-b_seq     序列bit score閾值 [不指定則使用默認(rèn)閾值]

-b_dom    結(jié)構(gòu)域bit score閾值[不指定則使用默認(rèn)閾值] 

 -align       在結(jié)果中顯示比對片段 [默認(rèn)關(guān)閉] 

 -as        預(yù)測Pfam-A數(shù)據(jù)庫匹配的active sites[默認(rèn)關(guān)閉] 

 -json [pretty]      輸出結(jié)果使用JSON格式。例如指定值為[pretty],則輸出結(jié)果會使用"pretty" JSON格式輸出 [默認(rèn)關(guān)閉] 

 -cpu     并行工作的CPU數(shù)目 [默認(rèn)全部]

-translate [mode]   將輸入序列視為DNA,并在搜索前使用6框翻譯的方法進(jìn)行轉(zhuǎn)換。如果翻譯模式[mode]被指定,則必須為"all"或者"orf"。"all"表示完整翻譯,包括終止子并且不產(chǎn)生單獨(dú)的ORFs;"orf"表示只翻譯和報(bào)告長度大于20的ORFs。
如果使用了翻譯參數(shù)而沒有指定翻譯模式,則默認(rèn)使用"orf"模式。[默認(rèn)關(guān)閉]

  • 例子
$  pfam_scan.pl -fasta ~/protein1.fa -dir ~/bio_softs/Pfam-A.hmm/ -outfile results_3.fa -as

<meta charset="utf-8">

三、結(jié)果格式

image

pfamscan蛋白結(jié)構(gòu)域部分分析結(jié)果說明如下:
(1) seq_id:轉(zhuǎn)錄本ID+[0,1,2],不存在于列表中的轉(zhuǎn)錄本為noncoding
(2) hmm start:比對到結(jié)構(gòu)域的起始位置
(3) hmm end:比對到結(jié)構(gòu)域的終止位置
(4) hmm acc:比對到pfam結(jié)構(gòu)域的ID
(5) hmm name:pfam結(jié)構(gòu)域名稱
(6) hmm length:pfam結(jié)構(gòu)域的長度
(7) bit score:比對打分分值
(8) E-value:比對的E值,pfam結(jié)構(gòu)域篩選的條件是: Evalue < 0.001

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容