通過(guò)blast在基因組中找相似序列

人類基因組中存在大量的重復(fù)區(qū)域,給定一段序列,如何知道這段序列在基因組中是否具有唯一比對(duì),或者具有多個(gè)比對(duì)?

一種方法是通過(guò)bwa,通過(guò)AS和XS 標(biāo)簽判斷是否有次優(yōu)比對(duì);但是這種方法無(wú)法知道這段序列所有可能的比對(duì)位置;

另一種方法就是blast,blast分為網(wǎng)頁(yè)版以及本地版;

網(wǎng)頁(yè)版blast

網(wǎng)址:https://blast.ncbi.nlm.nih.gov/Blast.cgi


點(diǎn)擊Human,出現(xiàn)如下頁(yè)面; 通過(guò)左上角的菜單,可選擇比對(duì)數(shù)據(jù)庫(kù)的類型;另外還可以設(shè)置參卡基因組的版本;


將序列復(fù)制到文本框中,點(diǎn)擊blast;

本地版blast

1. 建立比對(duì)數(shù)據(jù)庫(kù)

makeblastdb? ?-in? in.fasta? ?-dbtype nucl? -parse_seqids? -out? outdatabase

2. blast比對(duì)

blastn? -query? query.fasta? -out? ?query.fasta.blast? ?-db? outdatabase -outfmt? ?6

3. 比對(duì)結(jié)果如下

格式說(shuō)明:

Query id,? Subject id, % identity, alignment length, mismatches,?gap openings, q. start,? q. end,? s. start,? s. end,? e-value,? bit score

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容