前言
Sequencing depth and coverage: key considerations in genomic analyses.
現(xiàn)在接觸銷售人員進(jìn)行二代測(cè)序,掛在嘴邊的就是我們公司可以測(cè)多少X,即使是做了一段時(shí)間的分析的我有時(shí)候還是會(huì)疑惑,sequencing depth和covergae的區(qū)別是什么,正確的計(jì)算方法是什么,不同的二代測(cè)序技術(shù)不同的動(dòng)物模型需要測(cè)多少X才合適。下面我就簡(jiǎn)單的記錄一下自己的學(xué)習(xí)記錄。
結(jié)論
現(xiàn)在大家喜歡直接看結(jié)果,那我就直接拋出一個(gè)計(jì)算網(wǎng)站:
calculator
輸入讀段長(zhǎng)度,測(cè)序類型和基因組大小,就可以根據(jù)讀段數(shù)計(jì)算深度
正文
Sequencing depth and coverage: key considerations in genomic analyses
這篇文章就是對(duì)這個(gè)問(wèn)題的一個(gè)詳細(xì)討論,下面我給大家翻譯翻譯。


首先看截圖,我們可以知道,測(cè)序深度的計(jì)算公式為LN/G,L就是讀段長(zhǎng)度,N是讀段數(shù)目,G是基因組大小。
舉例來(lái)說(shuō),人類基因組3.1G,一個(gè)RNA-seq的reads數(shù)據(jù)為20M,數(shù)據(jù)為paired-end,讀長(zhǎng)150bp,那么測(cè)序深度就是20M2150/3.1G= 2 X
那我們?cè)賮?lái)討論一下sequencing depth 和 sequencing coverage的區(qū)別:
事實(shí)上沒(méi)有區(qū)別,若是真要講個(gè)說(shuō)法,那就是coverage可以理解為檢測(cè)到全基因組的多少區(qū)域(百分比,最大值為100%),但是sequencing covergae指的就是depth of sequencing coverage也就是sequencing depth,反映了一個(gè)區(qū)域被平均多少個(gè)reads檢測(cè)到。
另外breadth of coverage需要區(qū)別一下,就是將全基因組大小換成target region作為分母計(jì)算上面那個(gè)公司,
以下為高通量測(cè)序數(shù)據(jù)處理系列快速通道:
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(零):NGS分析如何選擇合適的參考基因組和注釋文件
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(一):比對(duì)軟件STAR的使用
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(二):Read Counts的提取
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(三):Pathway Analysis及GSEA
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(四):DeepTools學(xué)習(xí)筆記
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(五):上傳二代測(cè)序數(shù)據(jù)到GEO
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(六):什么是測(cè)序深度和測(cè)序覆蓋度?
高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(七):使用ChIPQC包檢查ChIP-seq的質(zhì)量