有關(guān)基因組大小的單位換算

原先一直以為測(cè)序的bp和byte是等價(jià)的,原來(lái)對(duì)fastq來(lái)說(shuō),其實(shí):

4 bases = 1 byte\\

利用

1 Kilo base pairs (KB) = 1,000 BP\\
1 Mega base pair (MB) = 1,000,000 BP or 1000 KB\\
1 Giga base pairs (Gb) = 1,000,000,000 BP or 1000 MB\\
1 Terra base pairs (TB) = 1000 GB\\
1 Peta base (PB) = 1000 TB\\

(公式要怎么換行???)

舉例:

如果測(cè)序reads總量4,000,000,average read length為150bp,基因組大小是50M,估算基因組coverage/depth大?。?/p>

應(yīng)該是,

總長(zhǎng) 4,000,000x150 bp=600,000,000 bp /4=150,000,000 BT=150M

但其實(shí)fastq格式儲(chǔ)存的數(shù)據(jù)大小要比實(shí)際的數(shù)據(jù)量虛高一些,所以實(shí)際的fastq文件要大。

coverage=測(cè)序數(shù)據(jù)大小150M/基因組大小50M = 3

結(jié)語(yǔ):

熟知單位換算對(duì)預(yù)測(cè)測(cè)序結(jié)果提前估量有一定的幫助,當(dāng)測(cè)序結(jié)果未達(dá)到要求時(shí),可以合理要求測(cè)序公司對(duì)不符合的樣本重新上機(jī)測(cè)序。有關(guān)問(wèn)題歡迎一起來(lái)探討啊

參考:

Base vs Byte: Estimating the storage requirement of sequencing - SEQOME

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容