給FASTA文件建立索引1:用于查找

給FASTA文件建立索引的目的是為了更快速的訪問(wèn)序列文件的某一特定的內(nèi)容。比如,可以通過(guò)指定基因組中的具體某個(gè)染色體上的某段位置,來(lái)找到其對(duì)應(yīng)的序列。

實(shí)現(xiàn)方法是通過(guò)samtools工具中的faidx命令來(lái)執(zhí)行。

首先需要對(duì)原始的FASTA文件生成索引文件:

```

samtools faidx <文件名>

```

之后就會(huì)在相應(yīng)的目錄中生成一個(gè)與FASTA同名,并以.fai結(jié)尾的文件,這個(gè)文件即是對(duì)應(yīng)的索引文件。

然后 我們就可以通過(guò)位置進(jìn)行查找了:

```bash

samtools faidx <in.fa> <region>

```

<in.fa>即是FASTA 文件名,<region>的格式是染色體號(hào):其實(shí)堿基位置-結(jié)束堿基位置

如:

```bash

samtools faidx Mus.....8.fa 8:123407082-123410744?

```

即是Mus..8.fa這個(gè)FASTA文件中,找8號(hào)染色體上,123407082到123410744位置之間的堿基序列。

支持同時(shí)寫(xiě)多個(gè)序列<region>同時(shí)查找。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容