1. 將fasta中的header name替換為對應(yīng)的fasta文件名
#輸出在屏幕,不修改原文件
awk '/^>/{print ">" substr(FILENAME,1,length(FILENAME)-6); next} 1' *.fasta
#直接修改原文件
for file in *.fna_16s; do sed -i "s/>.*/>${file%%.*}/" "$file" ; done
#${file%%.*}中的%%表示file中只保留.左邊的字符串
2. 提取fasta文件第一條序列信息
for file in *.fna_16s; do seqkit head -n 1 $file -o /home/czh/Desktop/02_BD177_compare_genome/00_BD177_phy_16s/119genome_16s_seq/${file}; done
3. 批量修改文件名
1.將‘img_000NNNN.jpeg’變成‘dan_NNNN.jpg’。
# rename -v 's/img_\d{3}(\d{4})\.jpeg$/dan_$1\.jpg/' *jpeg
img_0005417.jpeg renamed as dan_5417.jpg
img_0005418.jpeg renamed as dan_5418.jpg
img_0005419.jpeg renamed as dan_5419.jpg
img_0005420.jpeg renamed as dan_5420.jpg
img_0005421.jpeg renamed as dan_5421.jpg
實際操作:
將GCA_000240325.1_ASM24032v1_genomic.fna改成 ASM24032v1.fna
rename -v 's/GCA_\d{3}(\d{
2.將.jpeg 文件改成 *.jpg。
$ rename 's/\.jpeg$/\.jpg/' *.jpeg 好用!
3. 把所有的文件名大小寫修改:
rename 'y/A-Z/a-z/' *
rename 'y/a-z/A-Z/' *
#將.fna后綴的文件修改成.fasta后綴
rename 's/.fna/.fasta/' *
#給文件后添加后綴
rename 's/$/\.txt/' *
批量移動一個目錄下所有的gff格式的文件到指定文件夾
cp /home/czh/bacteriaData/Annotation/*/*.gff /home/czh/bacteriaData/Annotation/compaireds
解壓文件
gzip -d java.gz
查看當(dāng)前目錄下有文件個數(shù),包括子目錄下的文件
find . -type f -print|wc -l
linux下如何將當(dāng)前目錄的文件名存到一個文本文件里
find . -type f -name "*.gz" > 1.txt
將BD177_0001后面的空格替換成“|”
notepad中查找(^>\S+)\s
替換成$1\|
####批量修改fasta文件的標(biāo)題
find . -type f -name "*.faa" > name_list
將fasta中>KM 開頭的標(biāo)題修改成>ref|prokka|
for i in $(cat name_list); do sed 's/>KM/\>ref\|prokka\|'$i'/' $i.faa > 1_$i.faa; done
將fasta中以>開頭的行的末尾加|
for i in $(cat name_list); do sed 's/^\(>.*\)/\1\|/' $i.fasta > $i.fasta1; done
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。