在進(jìn)行組裝和比對(duì)過(guò)程中,要將測(cè)序ID替換成物種學(xué)名,一個(gè)一個(gè)替換太慢了,發(fā)現(xiàn)seqkit有這個(gè)功能。
seqkit replace --ignore-case --kv-file rename.txt --pattern "^(\w+)" --replacement "{kv}" genome.fa -o genome.new.fa
rename.txt 就是改名列表,第一列是原ID,第二列是新ID,中間用tab隔開(kāi)。 genome.fa 是需要改ID的文件名,genome.new.fa 是新生成的改ID后的文件名。特別要注意的是列表中一定要包含所有的ID,不然他會(huì)將列表中不包含的ID改成空白
GN002 Drymonia_coccinea_GN002
GN003 Glossoloma_anomalum_GN003
GN004 Moussonia_elegans_GN004
改名前

image.png
改名后

image.png