2024-07-24 基因組FASTA文件中每個序列(染色體或其他序列)的大小的計算

工具faSize,下載地址:https://hgdownload.soe.ucsc.edu/downloads.html#utilities_downloads
用法:faSize file(s).fa faSize

-detailed :輸出每條記錄的名稱和大小。
-tab :以制表符分隔格式輸出統(tǒng)計信息。
-veryDetailed :為每個記錄/序列輸出以下值:
name:序列的名稱
size:序列的大小
Ns:硬掩蔽堿基的數(shù)量
real:非硬掩碼堿基的數(shù)量
upper:大寫的堿基數(shù)
lower:小寫的堿基數(shù)(軟掩碼)

實戰(zhàn):
/path/kent/faSize -detailed /path/Mus_musculus.GRCm39.dna.primary_assembly.fa | sort -k1,1 -k2,2n > mm39_genome.sizes

/path/kent/faSize -detailed /path/Homo_sapiens.GRCh38.dna.primary_assembly.fa | sort -k1,1 -k2,2n > hg38_genome.sizes

image.png
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
禁止轉載,如需轉載請通過簡信或評論聯(lián)系作者。

相關閱讀更多精彩內容

友情鏈接更多精彩內容