關(guān)于測(cè)序數(shù)據(jù)去重問(wèn)題網(wǎng)上有很多大神的分析,我就不濫竽充數(shù)了,我挑取了幾篇比較好的文章:
第二代測(cè)序原理的詳細(xì)解析!
高通量測(cè)序之duplicated reads
試論NGS數(shù)據(jù)的Duplication問(wèn)題
如何去除二代測(cè)序數(shù)據(jù)中的PCR duplication才科學(xué)?
對(duì)于甲基化測(cè)序來(lái)說(shuō),主要根據(jù)建庫(kù)的不同來(lái)看是否需要去重:
- 全基因組甲基化測(cè)序(WGBS):跟普通測(cè)序一樣,需要去重
- 簡(jiǎn)并代表性甲基化測(cè)序(RRBS):由于酶切位點(diǎn)是固定,自然會(huì)產(chǎn)生較多的重復(fù)片段,因此不需去重
- 靶向甲基化測(cè)序(TBS):屬于擴(kuò)增子測(cè)序,因?yàn)槠螏缀醵际怯赡告湐U(kuò)增出來(lái)的,同一區(qū)域會(huì)擴(kuò)增出來(lái)許多相同的擴(kuò)增子,只要控制PCR過(guò)程不產(chǎn)生較大的bias就沒(méi)有問(wèn)題,因此也不必去重。