高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(六):什么是測(cè)序深度和測(cè)序覆蓋度?

前言

Sequencing depth and coverage: key considerations in genomic analyses.

現(xiàn)在接觸銷售人員進(jìn)行二代測(cè)序,掛在嘴邊的就是我們公司可以測(cè)多少X,即使是做了一段時(shí)間的分析的我有時(shí)候還是會(huì)疑惑,sequencing depth和covergae的區(qū)別是什么,正確的計(jì)算方法是什么,不同的二代測(cè)序技術(shù)不同的動(dòng)物模型需要測(cè)多少X才合適。下面我就簡(jiǎn)單的記錄一下自己的學(xué)習(xí)記錄。

結(jié)論

現(xiàn)在大家喜歡直接看結(jié)果,那我就直接拋出一個(gè)計(jì)算網(wǎng)站:
calculator
輸入讀段長(zhǎng)度,測(cè)序類型和基因組大小,就可以根據(jù)讀段數(shù)計(jì)算深度

正文

Sequencing depth and coverage: key considerations in genomic analyses
這篇文章就是對(duì)這個(gè)問(wèn)題的一個(gè)詳細(xì)討論,下面我給大家翻譯翻譯。

簡(jiǎn)單翻譯

key point

首先看截圖,我們可以知道,測(cè)序深度的計(jì)算公式為LN/G,L就是讀段長(zhǎng)度,N是讀段數(shù)目,G是基因組大小。

舉例來(lái)說(shuō),人類基因組3.1G,一個(gè)RNA-seq的reads數(shù)據(jù)為20M,數(shù)據(jù)為paired-end,讀長(zhǎng)150bp,那么測(cè)序深度就是20M2150/3.1G= 2 X

那我們?cè)賮?lái)討論一下sequencing depth 和 sequencing coverage的區(qū)別
事實(shí)上沒(méi)有區(qū)別,若是真要講個(gè)說(shuō)法,那就是coverage可以理解為檢測(cè)到全基因組的多少區(qū)域(百分比,最大值為100%),但是sequencing covergae指的就是depth of sequencing coverage也就是sequencing depth,反映了一個(gè)區(qū)域被平均多少個(gè)reads檢測(cè)到。
另外breadth of coverage需要區(qū)別一下,就是將全基因組大小換成target region作為分母計(jì)算上面那個(gè)公司,


以下為高通量測(cè)序數(shù)據(jù)處理系列快速通道:

高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(零):NGS分析如何選擇合適的參考基因組和注釋文件

高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(一):比對(duì)軟件STAR的使用

高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(二):Read Counts的提取

高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(三):Pathway Analysis及GSEA

高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(四):DeepTools學(xué)習(xí)筆記

高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(五):上傳二代測(cè)序數(shù)據(jù)到GEO

高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(六):什么是測(cè)序深度和測(cè)序覆蓋度?

高通量測(cè)序數(shù)據(jù)處理學(xué)習(xí)記錄(七):使用ChIPQC包檢查ChIP-seq的質(zhì)量

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容