本地blast

  1. 建立比對數(shù)據(jù)庫
    makeblastdb -in Ms.Unigene.fa -dbtype nucl -parse_seqids -out Msrna '##建立比對數(shù)據(jù)庫
    -in 數(shù)據(jù)來源fasta 格式,
    -dbtype 數(shù)據(jù)庫類型, nucl 代表核酸 prot為蛋白質(zhì)
    -parse_seqids 用途不明,建議加上,
    -out 數(shù)據(jù)庫名稱
    執(zhí)行上述代碼后將生成后綴為nin,nhr,nsq,nsi,nsd,nog六個(gè)文件,至此,自定義搜索庫文件生成完成


    image.png
  2. 開始blast

blast程序的基本格式

blast* -query [filename,輸入文件名] -db [dbname數(shù)據(jù)庫名稱] -out [outputfilename輸出文件名]
-query 比對序列文件,必須是fasta格式
-db 格式化好的數(shù)據(jù)庫名稱,需要先建庫
-out 輸出到文件
-outfmt # 輸出文件格式;
0 = pairwise,
1 = query-anchored showing identities,
2 = query-anchored no identities,
3 = flat query-anchored, show identities,
4 = flat query-anchored, no identities,
5 = XML Blast output,
6 = tabular,
7 = tabular with comment lines,
8 = Text ASN.1,
9 = Binary ASN.1
10 = Comma-separated values

-perc_identity # 指定結(jié)果中perc_identity 的范圍
-evalue 1e-5 #指定篩選標(biāo)準(zhǔn),超過指定evalue值的數(shù)據(jù)被舍棄,普通模式 1e-5
-num_threads #線程數(shù),根據(jù)電腦配置量力而行
-num_descriptions# tabular格式輸出結(jié)果的條數(shù)
blastn ## 核酸比對
blastp ## 蛋白比對
blastx ## 用核酸序列比對蛋白數(shù)據(jù)庫
tblastn## 蛋白序列對核酸庫的比對,現(xiàn)將核酸庫翻譯成蛋白庫,再將蛋白序列與翻譯后的蛋白庫進(jìn)行比對。
tblastx## 核酸與核酸數(shù)據(jù)庫在蛋白質(zhì)水平比較

短序列比對

blastn -task blastn-short -db Zea_mays.B73_RefGen_v4.dna.toplevel.fa -query primer.txt -word_size 7 -evalue 1 -out uniprimer.txt

短序列比對,不用-dbtype 及-parse_seqids

-task 指定任務(wù)類型,這里需要指定為blastn-short
-word_size 這里設(shè)為7
-evalue 指定篩選標(biāo)準(zhǔn),這里設(shè)為1,因?yàn)槎绦蛄械膃值一般會(huì)較大

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容