整理:dayueban
主要目的是方便日常對測序數(shù)據(jù),如編碼某個蛋白的基因在物種間序列上的相似性比較。
一、軟件下載和安裝
blast軟件網(wǎng)址:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/

選擇64位系統(tǒng)
- 軟件安裝,下載后,點擊安裝,和平時安裝軟件的方法無異,安裝位置可以是C盤或者其它盤,但是注意,一般的軟件最好選擇安裝位置的時候路徑中不要有中文,否則影響后續(xù)正常運行。
二、添加環(huán)境變量
安裝好后,會出現(xiàn)doc和bin兩個文件夾,doc是文件,bin是執(zhí)行程序所在的文件夾,將bin所在路徑添加到所在系統(tǒng)環(huán)境變量,方法為:首先右鍵點擊我的電腦——>屬性——>高級系統(tǒng)設置——>高級——>環(huán)境變量——>系統(tǒng)變量——>選擇
path——>編輯——>新建——>copy路徑:F:\bio-tools\blast\blast\bin到該位置——>確定,完成。win+R打開電腦運行,輸入cmd進入docs系統(tǒng),進入到blast軟件的bin路徑,輸入blastp -h,如果能出來幫助信息,說明安裝成功,接下來就可以進行相應的blast比對操作了。
三、blast試運行
- 首先blast運行比對之前,要對目標數(shù)據(jù)庫進行建索引
我在NCBI里下載了兩個細菌菌株的全基因組蛋白序列,一個是Eubacterium dolichum(a),一個是Eubacterium biforme(b)。其中a作為目標參考數(shù)據(jù)庫,b用于比對數(shù)據(jù)。
- 建索引
makeblastdb.exe -in db\Eubacterium_dolichum.faa -dbtype prot -out db\Eubacterium_dolichum.faa.blastdb
-
補坑,建立索引這一步,出現(xiàn)了相應的報錯,
blast Error: mdb_env_open: 磁盤空間不足。,在網(wǎng)上搜索一通,找到一個解決方法,就是在用戶變量里設置一個參數(shù):BLASTDB_LMDB_MAP_SIZE=1000000
圖二
解決了這個問題。 建立好索引之后,那就是將需要比對的序列去和參考序列進行比對,得到比對結果
blastp -query F:\bio-tools\blast\data\Eubacterium_biforme.faa -db db\Eubacterium_dolichum.faa.blastdb -out db\results.txt -outfmt 6 -evalue 1e-5
