人類基因組中存在大量的重復(fù)區(qū)域,給定一段序列,如何知道這段序列在基因組中是否具有唯一比對(duì),或者具有多個(gè)比對(duì)?
一種方法是通過(guò)bwa,通過(guò)AS和XS 標(biāo)簽判斷是否有次優(yōu)比對(duì);但是這種方法無(wú)法知道這段序列所有可能的比對(duì)位置;
另一種方法就是blast,blast分為網(wǎng)頁(yè)版以及本地版;
網(wǎng)頁(yè)版blast
網(wǎng)址:https://blast.ncbi.nlm.nih.gov/Blast.cgi

點(diǎn)擊Human,出現(xiàn)如下頁(yè)面; 通過(guò)左上角的菜單,可選擇比對(duì)數(shù)據(jù)庫(kù)的類型;另外還可以設(shè)置參卡基因組的版本;

將序列復(fù)制到文本框中,點(diǎn)擊blast;
本地版blast
1. 建立比對(duì)數(shù)據(jù)庫(kù)
makeblastdb? ?-in? in.fasta? ?-dbtype nucl? -parse_seqids? -out? outdatabase
2. blast比對(duì)
blastn? -query? query.fasta? -out? ?query.fasta.blast? ?-db? outdatabase -outfmt? ?6
3. 比對(duì)結(jié)果如下

格式說(shuō)明:
Query id,? Subject id, % identity, alignment length, mismatches,?gap openings, q. start,? q. end,? s. start,? s. end,? e-value,? bit score