測序深度和測序覆蓋度,怎么估算?

? ? 在我們開始測序之前,經(jīng)常會被問道,你需要的測序深度和測序覆蓋度的概念,比如在測序線粒體的DNA時候,測序小哥就問說1個G的數(shù)據(jù)量夠了嗎?下面就給大家解釋下這兩個概念:


(圖片來源于知乎余功旺)

測序深度(depths)

? ? ? 測序深度(depths)指測序得到的總堿基數(shù)與待測基因組大小的比值,簡單的說就是測序的數(shù)據(jù)量大小比上參考基因組/轉錄組的大小,通常結果用n×來表示。

測序深度=\frac{數(shù)據(jù)量大小}{ref基因組大小}

測序覆蓋度(coverage)

? ? ? 測序覆蓋度是測序所組裝的結果占整個基因組的比例,實際上,由于我們測序的結果通常不能組裝出完整的結果,因為在基因組上有很多的重復序列,高GC的結構存在,這使得組裝結果不能覆蓋整個參考基因組,這些沒有被組裝好的區(qū)域就叫做覆蓋度。

測序覆蓋度=\frac{組裝序列長度}{ref基因組長度}

實例

(1)小明請測序公司測序DNA樣本,采用Illumina PE150的測序平臺,采用雙端測序技術,生成150 bp的reads,單端的reads數(shù)目為3,300,000,Insert size為350 bp,測序的基因組大小為760 Mb,測序的樣品DNA不考慮樣品中的線粒體DNA影響,測序深度為( )×?

測序深度=\frac{數(shù)據(jù)量大小}{ref基因組大小}=\frac{150*3,300,000*2}{760*1024*1000}

(2) 我們有時候也說,我要測序1G的數(shù)據(jù)量,那么這種情況下測序深度是( )×?

測序深度=\frac{1G*1024*1024*1000}{760*1024*1000}

備注:(1)1G=1024Mb 1Mb=1024kb 1kb=1000bp

? ? ? ? ? ?(2)如果是測昆蟲線粒體基因組大小,一般1G的數(shù)據(jù)量夠了


Reference:

https://zhuanlan.zhihu.com/p/40040208

http://www.360doc.com/content/19/0123/16/52645714_810824928.shtml

https://zhuanlan.zhihu.com/p/74558512

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容