Rfam本地安裝教程

Rfam簡介

Rfam是Rfam是用來鑒定non-coding RNAs的數(shù)據(jù)庫,常用于注釋新的核酸序列或者基因組序列。Rfam:http://eddylab.org/infernal/
Rfam用戶手冊:http://eddylab.org/infernal/Userguide.pdf

1. 下載infernal軟件

# infernal-1.1.1.tar.gz 下載軟
#在你安裝軟件的文件中建立一個Rfam的文件
wget http://eddylab.org/software/infernal/infernal-1.1.1.tar.gz 
tar xf infernal/infernal-1.1.1.tar.gz
cd infernal/infernal-1.1.1.tar.gz
./configure  --prefix=`pwd`/../infernal_bin
#安裝步驟
make 
make install
cd easel; make install
cd ../../infernal_bin/bin
ls
#在該文件夾值就可以看到已安裝的文件
export PATH=${PATH}:`pwd`  #改變環(huán)境變量

2.下載數(shù)據(jù)庫

wget ftp://ftp.ebi.ac.uk/pub/databases/Rfam/12.2/Rfam.cm.gz
gunzip Rfam.cm.gz
wget ftp://ftp.ebi.ac.uk/pub/databases/Rfam/12.2/Rfam12.2.claninfo
#使用infernal中的cmpress引索Rfam.cm
../infernal_bin/bin/cmpress Rfam.cm  #我的必須進(jìn)入到該文件家中進(jìn)行
#輸出文件
Working...    done.
Pressed and indexed 2588 CMs and p7 HMM filters (2588 names and 2588 accessions).
Covariance models and p7 filters pressed into binary file:  Rfam.cm.i1m
SSI index for binary covariance model file:                 Rfam.cm.i1i
Optimized p7 filter profiles (MSV part)  pressed into:      Rfam.cm.i1f
Optimized p7 filter profiles (remainder) pressed into:      Rfam.cm.i1p
#表示完成

3. 查詢待測基因組的大小【必須】

../infernal_bin/bin/esl-seqstat ~/M.truncatula/Medtr_v4_0v1/JCVI.Medtr.v4.20130313.fasta
#輸出
Format:              FASTA
Alphabet type:       DNA
Number of sequences: 230
Total # residues:    532015 #該行是我們需要的數(shù)字考慮到基因組為雙鏈和下一步用到的參數(shù)的單位為Million,我們使用公式532015* 2 / 1000000計算得出結(jié)果為1.06403,作為下一步參數(shù)-Z的值.
Smallest:            202
Largest:             21302
Average length:      2313.1

運行

# Rfam12.2.claninfo 為下載的claninfo文件,需提供所在路徑
# Rfam.cm 下載的cm文件
# my-genome.fa 待查詢序列
# my-genome.cmscan 輸出結(jié)果
# my-genome.tblout 有一個輸出結(jié)果
cmscan -Z `esl-seqstat my-genome.fa | awk '{if($0~/^Total/) print int($4/2000000);}''` --cut_ga --rfam --nohmmonly --tblout my-genome.tblout --fmt 2 --clanin Rfam12.2.claninfo Rfam.cm my-genome.fa > my-genome.cmscan
#根據(jù)參考博客的博主命令如上,但是自己的運行時總是報錯,出不了結(jié)果

根據(jù)官網(wǎng)給出的使用手冊

image.png

根據(jù)使用手冊運行的

~/software/infernal_bin/bin/cmscan ~/software/Rfam/Rfam.cm ../candidate_fasta/CPC_fasta/u_cpc.fasta
#
 cmscan :: search sequence(s) against a CM database
# INFERNAL 1.1.1 (July 2014)
# Copyright (C) 2014 Howard Hughes Medical Institute.
# Freely distributed under the GNU General Public License (GPLv3).
# - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
# query sequence file:                   ../candidate_fasta/CPC_fasta/u_cpc.fasta
# target CM database:                    /root/software/Rfam/Rfam.cm
# number of worker threads:              1
# - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Query:       XLOC_000318::chr1:4780155-4784203()  [L=4048]

Hit scores:
 rank     E-value  score  bias  modelname   start    end   mdl trunc   gc  description
 ----   --------- ------ -----  ---------- ------ ------   --- ----- ----  -----------
 ------ inclusion threshold ------
  (1) ?      0.14   15.6   1.0  snR73        2280   2346 + hmm     - 0.30  -
  (2) ?      0.17   18.2   0.2  sroH         2044   1992 -  cm    no 0.25  -
  (3) ?       1.5   12.2   0.2  Afu_328      3042   3012 - hmm     - 0.29  -
  (4) ?       5.5   10.7   1.6  adapt33_1    3099   3052 - hmm     - 0.23  -
  (5) ?       5.8   18.7   0.0  SNORD19      3298   3375 +  cm    no 0.40  -
  (6) ?       6.5   16.5   0.1  snoR66       2441   2506 +  cm    no 0.26  -
  (7) ?       7.6    9.3   2.3  DLX6-AS1_2    136    241 + hmm     - 0.33  -
  (8) ?       9.4   23.9   0.2  KRAS_3UTR    1432   1501 +  cm    no 0.26  -


Hit alignments:
>> snR73  
 rank     E-value  score  bias mdl mdl from   mdl to       seq from      seq to       acc trunc   gc
 ----   --------- ------ ----- --- -------- --------    ----------- -----------      ---- ----- ----
  (1) ?      0.14   15.6   1.0 hmm        1       67 [.        2280        2346 + .. 0.66     - 0.30

                                           ::::::::::::::::::::.::::::::::::::::::::::::::::::::::::::::.::::::: CS
                                snR73    1 GUUUAUGAUGAuUucCacUU.aUCACGACGGUCAaCUGcGuUcuUCgAuUGUUUAuuuaaG.aACuUUG 67  
                                           GUU A GAUGAuUu  a+UU +UCA   C GUCAaCUG+G U+u C+  UG UUA   a+G +A uUU 
  XLOC_000318::chr1:4780155-4784203() 2280 GUUGAGGAUGAUUUUUAUUUaUUCAUAUCUGUCAACUGUGAUUUCCU--UGAUUAAACAGGuGAGUUUA 2346
                                           5778899******6666555499*****************9988774..55555544333323333333 PP
......................

在這步,卡住了
后續(xù)再繼續(xù)...............
[2019.8.20]

參考:本地使用Rfam

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 轉(zhuǎn)載 :https://www.plob.org/article/3856.html 生物信息數(shù)據(jù)庫與查詢 近年來...
    oddxix閱讀 11,494評論 0 37
  • 前言 之前看panda姐的blog時,發(fā)現(xiàn)介紹了篇關(guān)于Metagenome的分析教程,剛好就想著試著翻譯下,作為我...
    電泳菌要努力閱讀 4,141評論 0 9
  • 日精進(jìn)打卡第92天 姓名:劉章建 499期學(xué)員 感謝二組 公司:上海緣綴包裝材料有限公司 【知~學(xué)習(xí)】 《六項精...
    駱駝哥哥劉章建閱讀 144評論 0 0
  • 這個夏天 雷總喜歡吵吵鬧鬧 擾人清夢 真是熊孩子 風(fēng)一直不停地歌唱 雖然跑了調(diào) 難聽了點 雨卻在窗臺上涂鴉 莫名其...
    小道士5寶閱讀 190評論 0 0
  • 春潮水巷 梨花帶雨 小舟泛波漪 美人何歸去 一杯曲殤 吟罷醉 花謝飛處 夢中誰舞飛 吾自長望 雨中送蓑衣 詩詞點綴...
    趙藝閎Z閱讀 255評論 0 0

友情鏈接更多精彩內(nèi)容