Windows本地安裝blast軟件并簡單比對分析

整理:dayueban

主要目的是方便日常對測序數(shù)據(jù),如編碼某個蛋白的基因在物種間序列上的相似性比較。

一、軟件下載和安裝

blast軟件網(wǎng)址:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/

選擇64位系統(tǒng)
  • 軟件安裝,下載后,點擊安裝,和平時安裝軟件的方法無異,安裝位置可以是C盤或者其它盤,但是注意,一般的軟件最好選擇安裝位置的時候路徑中不要有中文,否則影響后續(xù)正常運行。

二、添加環(huán)境變量

  • 安裝好后,會出現(xiàn)doc和bin兩個文件夾,doc是文件,bin是執(zhí)行程序所在的文件夾,將bin所在路徑添加到所在系統(tǒng)環(huán)境變量,方法為:首先右鍵點擊我的電腦——>屬性——>高級系統(tǒng)設置——>高級——>環(huán)境變量——>系統(tǒng)變量——>選擇path——>編輯——>新建——>copy路徑:F:\bio-tools\blast\blast\bin到該位置——>確定,完成。

  • win+R打開電腦運行,輸入cmd進入docs系統(tǒng),進入到blast軟件的bin路徑,輸入blastp -h,如果能出來幫助信息,說明安裝成功,接下來就可以進行相應的blast比對操作了。

三、blast試運行

  • 首先blast運行比對之前,要對目標數(shù)據(jù)庫進行建索引

我在NCBI里下載了兩個細菌菌株的全基因組蛋白序列,一個是Eubacterium dolichum(a),一個是Eubacterium biforme(b)。其中a作為目標參考數(shù)據(jù)庫,b用于比對數(shù)據(jù)。

  • 建索引
makeblastdb.exe -in db\Eubacterium_dolichum.faa -dbtype prot -out db\Eubacterium_dolichum.faa.blastdb
  • 補坑,建立索引這一步,出現(xiàn)了相應的報錯,blast Error: mdb_env_open: 磁盤空間不足。,在網(wǎng)上搜索一通,找到一個解決方法,就是在用戶變量里設置一個參數(shù):BLASTDB_LMDB_MAP_SIZE=1000000

    圖二

    解決了這個問題。

  • 建立好索引之后,那就是將需要比對的序列去和參考序列進行比對,得到比對結果

blastp -query F:\bio-tools\blast\data\Eubacterium_biforme.faa -db db\Eubacterium_dolichum.faa.blastdb -out db\results.txt -outfmt 6 -evalue 1e-5

參考

[1] windows下的blast+安裝與使用

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內(nèi)容