工具faSize,下載地址:https://hgdownload.soe.ucsc.edu/downloads.html#utilities_downloads
用法:faSize file(s).fa faSize
-detailed :輸出每條記錄的名稱和大小。
-tab :以制表符分隔格式輸出統(tǒng)計信息。
-veryDetailed :為每個記錄/序列輸出以下值:
name:序列的名稱
size:序列的大小
Ns:硬掩蔽堿基的數(shù)量
real:非硬掩碼堿基的數(shù)量
upper:大寫的堿基數(shù)
lower:小寫的堿基數(shù)(軟掩碼)
實戰(zhàn):
/path/kent/faSize -detailed /path/Mus_musculus.GRCm39.dna.primary_assembly.fa | sort -k1,1 -k2,2n > mm39_genome.sizes
/path/kent/faSize -detailed /path/Homo_sapiens.GRCh38.dna.primary_assembly.fa | sort -k1,1 -k2,2n > hg38_genome.sizes

image.png