使用seqkit批量替換序列ID

在進(jìn)行組裝和比對(duì)過(guò)程中,要將測(cè)序ID替換成物種學(xué)名,一個(gè)一個(gè)替換太慢了,發(fā)現(xiàn)seqkit有這個(gè)功能。

seqkit replace --ignore-case --kv-file rename.txt --pattern "^(\w+)" --replacement "{kv}" genome.fa -o genome.new.fa
rename.txt 就是改名列表,第一列是原ID,第二列是新ID,中間用tab隔開(kāi)。 genome.fa 是需要改ID的文件名,genome.new.fa 是新生成的改ID后的文件名。特別要注意的是列表中一定要包含所有的ID,不然他會(huì)將列表中不包含的ID改成空白

GN002   Drymonia_coccinea_GN002
GN003   Glossoloma_anomalum_GN003
GN004   Moussonia_elegans_GN004

改名前


image.png

改名后


image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容