2011年,美國(guó)Pacific Biosciences 公司正式發(fā)售第三代測(cè)序系統(tǒng)—PacBio RS。這是一臺(tái)革命性的DNA測(cè)序系統(tǒng),它融合了新穎的單分子測(cè)序技術(shù)和高級(jí)的分析技術(shù),在測(cè)序歷史上首次實(shí)現(xiàn)了人類(lèi)觀測(cè)單個(gè)DNA聚合酶合成過(guò)程的夢(mèng)想。它有著其他系統(tǒng)無(wú)法比擬的序列讀長(zhǎng),高達(dá)3000 bp。

???????PacBio Sequel第三代單分子實(shí)時(shí)測(cè)序系統(tǒng),不同于市面上其它基于模板PCR擴(kuò)增后才能進(jìn)行測(cè)序的系統(tǒng),其核心技術(shù)是單分子測(cè)序技術(shù),無(wú)需對(duì)模板DNA 進(jìn)行擴(kuò)增,使研究者第一次能夠大規(guī)模、平行、連續(xù)地實(shí)時(shí)觀測(cè)到單個(gè)DNA 聚合酶對(duì)每個(gè)模板序列的合成,進(jìn)行堿基序列測(cè)定。在測(cè)序性能方面還具有以下突出優(yōu)勢(shì):

1. 無(wú)于倫比的長(zhǎng)讀長(zhǎng)(平均讀長(zhǎng)可達(dá)10-18kbp,最長(zhǎng)60Kb)大幅提高定位準(zhǔn)確性及拼接效率,大大簡(jiǎn)化后續(xù)的生物信息學(xué)數(shù)據(jù)處理。有利于闡釋基因組所發(fā)生的變異以及大尺度結(jié)構(gòu)重排等信息。
2. 單分子實(shí)時(shí)檢測(cè),無(wú)需PCR擴(kuò)增,避免PCR引入的系統(tǒng)誤差及對(duì)擴(kuò)增片段的偏好性引起的信息缺失。每一條模板鏈都可獲得相應(yīng)序列信息,數(shù)據(jù)覆蓋均勻,準(zhǔn)確; 還可以檢測(cè)包括稀有變異在內(nèi)的各種突變型,反映各種突變型的頻率。
3. 無(wú)需PCR,覆蓋深度幾乎不受序列中GC含量差異的影響,可測(cè)定高GC含量的區(qū)域,高度重復(fù)片段區(qū)域,100% A+T序列等基于模板PCR的測(cè)序技術(shù)難以逾越的區(qū)段。
4. 可同時(shí)獲得聚合酶反應(yīng)動(dòng)力學(xué)信息,進(jìn)行甲基化等修飾堿基的直接測(cè)定,還可區(qū)分不同基團(tuán)的甲基化修飾及其它堿基修飾。
PacBio Sequel第三代單分子實(shí)時(shí)測(cè)序系統(tǒng)
與PacBio Sequel測(cè)序系統(tǒng)相比,PacBio SequelⅡ芯片支持8M SMRT Cell ,單張芯片測(cè)序通量提升了8倍,并可產(chǎn)出高精準(zhǔn)度的長(zhǎng)讀長(zhǎng)HiFi reads,堿基準(zhǔn)確度可達(dá)99.9% 以上,具有測(cè)序通量更高、耗時(shí)更短、準(zhǔn)確度更高、應(yīng)用更靈活等特點(diǎn)。

PacBio SMRT測(cè)序原理
與二代Illumina測(cè)序平臺(tái)相比,三代測(cè)序平臺(tái)PacBio SequelⅡ應(yīng)用SMRT 測(cè)序技術(shù)實(shí)現(xiàn)單分子實(shí)時(shí)測(cè)序。SMRT 測(cè)序原理是以SMRT Cell為載體,每個(gè)SMRT Cell上布滿(mǎn)了數(shù)百萬(wàn)個(gè)零模波導(dǎo)孔(ZMW),測(cè)序時(shí)DNA聚合酶和一條模板分子被瞄定在ZMW孔底部進(jìn)行反應(yīng),位于小孔底部的激發(fā)光能夠激發(fā)核苷酸底物上的熒光標(biāo)記,進(jìn)而通過(guò)監(jiān)測(cè)系統(tǒng)將熒光信號(hào)記錄下來(lái),從而獲得堿基信息。整個(gè)測(cè)序過(guò)程 DNA 分子不需要經(jīng)過(guò)PCR擴(kuò)增,實(shí)現(xiàn)了對(duì)每一條DNA分子的單獨(dú)測(cè)序。
3.平臺(tái)優(yōu)勢(shì):
A.長(zhǎng)讀長(zhǎng)、高產(chǎn)出
PacBio Sequel II 測(cè)序Polymerase reads 平均讀長(zhǎng)可達(dá) 25kb 以上,N50 在 35kb 以上,另外目前單個(gè) SMRT Cell 產(chǎn)量有大幅提升,安諾基因目前CLR模式單個(gè) SMRT Cell 的數(shù)據(jù)產(chǎn)量平均在 110Gb 左右,而CCS模式平均單個(gè)SMRT Cell 的數(shù)據(jù)產(chǎn)量位250Gb左右。

SequelII平臺(tái)酶讀長(zhǎng)展示
B.高一致性準(zhǔn)確度
PacBio SMRT 測(cè)序的原始數(shù)據(jù)錯(cuò)誤率在 10%~12% 左右,但這種錯(cuò)誤率是隨機(jī)發(fā)生的,不存在系統(tǒng)偏好性,因此,PacBio測(cè)序可以利用自身的數(shù)據(jù)進(jìn)行糾錯(cuò),當(dāng)數(shù)據(jù)深度達(dá)到 50X 左右時(shí),一致性序列準(zhǔn)確性超過(guò)99.999%(QV50),這也是ONT平臺(tái)測(cè)序存在同聚物偏好性錯(cuò)誤而無(wú)法自身進(jìn)行校正無(wú)法比擬的。
C.均勻的覆蓋度
大多數(shù)測(cè)序系統(tǒng)受到覆蓋偏好性的困擾,從而導(dǎo)致富含AT或富含GC的DNA區(qū)域、高度重復(fù)序列等難以測(cè)序。這往往會(huì)導(dǎo)致不完整基因組覆蓋率,甚至?xí)谧罱K結(jié)果中造成高達(dá)15%的基因組信息缺失。單分子實(shí)時(shí)(SMRT)測(cè)序不需要擴(kuò)增步驟,可實(shí)現(xiàn)對(duì)整個(gè)基因組的均勻覆蓋。這樣就能夠測(cè)序回文序列和多樣性程度低的基因組區(qū)域,同時(shí)長(zhǎng)讀長(zhǎng)測(cè)序同樣能夠跨越復(fù)雜區(qū)域。
