測(cè)序技術(shù)

前言

本文并非原創(chuàng),來自多篇博文摘錄。

第一節(jié) NGS測(cè)序技術(shù)

在真正開始數(shù)據(jù)分析之前先知道我們是如何將那些原本存在于細(xì)胞中的DNA信息獲取出來的——也就是測(cè)序的原理,總是有益的。

測(cè)序,簡(jiǎn)單來說就是將DNA化學(xué)信號(hào)轉(zhuǎn)變?yōu)橛?jì)算機(jī)可處理的數(shù)字信號(hào)。

它從1977年的第一代Sanger技術(shù)發(fā)展至今,已經(jīng)足有40年時(shí)間。在這個(gè)技術(shù)發(fā)展的更迭歷程中,測(cè)序讀長(zhǎng)從長(zhǎng)到短,再?gòu)亩痰介L(zhǎng)。雖然就當(dāng)前形勢(shì)看第二代短讀長(zhǎng)測(cè)序技術(shù)在全球范圍內(nèi)上占有著絕對(duì)的壟斷位置,但第三測(cè)序技術(shù)也已在這幾年快速地發(fā)展著。測(cè)序技術(shù)的每一次變革和突破,都對(duì)基因組學(xué)研究,疾病醫(yī)療研究,藥物研發(fā),育種等領(lǐng)域產(chǎn)生巨大的推動(dòng)作用。所以在這個(gè)系列的第一篇里我將對(duì)當(dāng)前最主流的測(cè)序技術(shù)以及它們的測(cè)序原理做一個(gè)全面的介紹。

圖1. 測(cè)序技術(shù)發(fā)展歷程

第一代測(cè)序技術(shù)

第一代DNA測(cè)序技術(shù)用的是1975年由桑格(Sanger)和考爾森(Coulson)開創(chuàng)的鏈終止法或者是1976-1977年由馬克西姆(Maxam)和吉爾伯特(Gilbert)發(fā)明的化學(xué)法(鏈降解). 并在1977年,由桑格老人家測(cè)定了第一個(gè)基因組序列——噬菌體phiX-174,全長(zhǎng)只有5,375個(gè)堿基。雖然與今日的技術(shù)比起來根本不算什么,但自此之后,人類獲得了窺探生命本質(zhì)的能力,并以此為開端真正步入了基因組學(xué)時(shí)代。

研究人員在Sanger法的多年實(shí)踐之中不斷對(duì)其進(jìn)行改進(jìn)。在2001年,完成的首個(gè)人類基因組圖譜就是以改進(jìn)了的Sanger法為基礎(chǔ)進(jìn)行測(cè)序的。Sanger法的核心原理是:由于ddNTP(4種帶有熒光標(biāo)記的A,C,G,T堿基)的2’和3’都不含羥基,其在DNA的合成過程中不能形成磷酸二酯鍵,因此可以用來中斷DNA的合成反應(yīng),在4個(gè)DNA合成反應(yīng)體系中分別加入一定比例帶有放射性同位素標(biāo)記的ddNTP(分別為:ddATP,ddCTP,ddGTP和ddTTP),然后利用凝膠電泳和放射自顯影后可以根據(jù)電泳帶的位置確定待測(cè)分子的DNA序列(圖2)。這個(gè)Sanger測(cè)序法短片為Sanger測(cè)序法制作了一個(gè)小短片,形象而生動(dòng)。
值得注意的是,在測(cè)序技術(shù)起步發(fā)展的這一時(shí)期中,除了Sanger法之外還出現(xiàn)了一些其他的測(cè)序技術(shù),如焦磷酸測(cè)序法、連接酶法等。其中,焦磷酸測(cè)序法是后來Roche公司454技術(shù)所使用的測(cè)序方法,而連接酶測(cè)序法是后來ABI公司SOLID使用的測(cè)序方法,但他們的核心手段都是利用了Sanger中可中斷DNA合成反應(yīng)的dNTP。

第二代測(cè)序技術(shù)

總的來說,第一代測(cè)序技術(shù)的主要特點(diǎn)是測(cè)序讀長(zhǎng)可達(dá)1,000bp,準(zhǔn)確性高達(dá)99.999%,但其測(cè)序成本高,通量低等方面的缺點(diǎn),嚴(yán)重影響了其真正大規(guī)模的應(yīng)用。因而第一代測(cè)序技術(shù)并不是理想的測(cè)序方法。經(jīng)過不斷的技術(shù)開發(fā)和改進(jìn),以Roche公司的454技術(shù)、illumina公司的Solexa/HiSeq技術(shù)和ABI公司的SOLID技術(shù)為標(biāo)記的第二代測(cè)序技術(shù)誕生了。第二代測(cè)序技術(shù)在大幅提高了測(cè)序速度的同時(shí),還大大地降低了測(cè)序成本,并且保持了高準(zhǔn)確性,以前完成一個(gè)人類基因組的測(cè)序需要3年時(shí)間,而使用二代測(cè)序技術(shù)則僅僅需要1周,但其序列讀長(zhǎng)方面比起第一代測(cè)序技術(shù)則要短很多,大多只有100bp-150bp。圖3. 是第一代和第二代測(cè)序技術(shù)測(cè)序成本作了一個(gè)簡(jiǎn)單的比較,可以看出自第二代測(cè)序技術(shù)發(fā)展出來之后,歷史開始發(fā)生根本性的改變,測(cè)序的成本開始快速實(shí)現(xiàn)斷崖式下降,也就是業(yè)內(nèi)經(jīng)常提到的 超摩爾定律 現(xiàn)象。

圖3. 測(cè)序成本比較(來源:NIH網(wǎng)站)

illumina

目前illumina的測(cè)序儀占全球75%以上,以HiSeq系列為主。它的機(jī)器采用的都是邊合成邊測(cè)序的方法,主要分為以下4個(gè)步驟:

圖4. illumina測(cè)序原理(來源:illumina官網(wǎng))

1)構(gòu)建DNA測(cè)序文庫(kù),圖4-1

簡(jiǎn)單來說就是把一堆亂糟糟的DNA分子用超聲波打斷成一定長(zhǎng)度范圍的小片段。目前除了一些特殊的需求之外,基本都是打斷為300bp-800bp長(zhǎng)的序列片段,并在這些小片段的兩端添加上不同的接頭【注】,構(gòu)建出單鏈DNA文庫(kù),以備測(cè)序之用;

【注】接頭在illumina中一般分為P5和P7接頭,其中一個(gè)帶有和flowcell上的探針反向互補(bǔ)的序列,以完成待測(cè)序列和探針結(jié)合的作用,另外一個(gè)接頭帶有barcord序列以區(qū)分不同的樣本。

2)測(cè)序流動(dòng)槽(flowcell),圖4-2

flowcell是用于吸附流動(dòng)DNA片段的槽道,也是核心的測(cè)序反應(yīng)容器——所有的測(cè)序過程就發(fā)生在這里。當(dāng)文庫(kù)建好后,這些文庫(kù)中的DNA在通過flowcell的時(shí)候會(huì)隨機(jī)附著在flowcell表面的槽道(稱為lane)上。每個(gè)flowcell有8個(gè)lane(圖5),每個(gè)lane的表面都附有很多接頭,這些接頭能和建庫(kù)過程中加在DNA片段兩端的接頭相互配對(duì),這就是為什么flowcell能吸附建庫(kù)后的DNA的原因,并能支持DNA在其表面進(jìn)行橋式PCR的擴(kuò)增,理論上這些lane之間是不會(huì)相互影響的。

3)橋式PCR擴(kuò)增與變性

圖6. 橋式PCR擴(kuò)增(來源:illumina官網(wǎng))

這是NGS技術(shù)的一個(gè)核心特點(diǎn)。橋式PCR以flowcell表面所固定的序列為模板,進(jìn)行橋形擴(kuò)增,如圖6所示。經(jīng)過不斷的擴(kuò)增和變性循環(huán),最終每個(gè)DNA片段都將在各自的位置上集中成束,每一個(gè)束都含有單個(gè)DNA模板的很多分拷貝,這一過程的目的在于實(shí)現(xiàn)將單一堿基的信號(hào)強(qiáng)度進(jìn)行放大,以達(dá)到測(cè)序所需的信號(hào)要求。

4)測(cè)序,如圖4-4和圖7所示

測(cè)序方法采用邊合成邊測(cè)序的方法。向反應(yīng)體系中同時(shí)添加DNA聚合酶、接頭引物和帶有堿基特異熒光標(biāo)記的4中dNTP(如同Sanger測(cè)序法)。這些dNTP的3’-OH被化學(xué)方法所保護(hù),因而每次只能添加一個(gè)dNTP,這就確保了在測(cè)序過程中,一次只會(huì)被添加一個(gè)堿基。同時(shí)在dNTP被添加到合成鏈上后,所有未使用的游離dNTP和DNA聚合酶會(huì)被洗脫掉。接著,再加入激發(fā)熒光所需的緩沖液,用激光激發(fā)熒光信號(hào)(圖7),并有光學(xué)設(shè)備完成熒光信號(hào)的記錄,最后利用計(jì)算機(jī)分析將光學(xué)信號(hào)轉(zhuǎn)化為測(cè)序堿基。這樣熒光信號(hào)記錄完成后,再加入化學(xué)試劑淬滅熒光信號(hào)并去除dNTP 3’-OH保護(hù)基團(tuán),以便能進(jìn)行下一輪的測(cè)序反應(yīng)。

Illumina的這種每次只添加一個(gè)dNTP的技術(shù)特點(diǎn)能夠很好的地解決同聚物長(zhǎng)度的準(zhǔn)確測(cè)量問題,它的主要測(cè)序錯(cuò)誤來源是堿基的替換,目前它的測(cè)序錯(cuò)誤率在1%-1.5%左右。測(cè)序周期以人類基因組重測(cè)序?yàn)槔?0x-50x測(cè)序深度對(duì)于Hisq系列需要3-5天時(shí)間,而對(duì)于2017年初最新推出的NovaSeq系列則只需要40個(gè)小時(shí)!

Roche 454

Roche 454測(cè)序系統(tǒng)是第一個(gè)商業(yè)化運(yùn)營(yíng)二代測(cè)序技術(shù)的平臺(tái)。它的主要測(cè)序原理是(圖8 abc)2:

(1)DNA文庫(kù)制備

Roche 454測(cè)序系統(tǒng)的文件構(gòu)建方式和illumina的不同,它是利用噴霧法將待測(cè)DNA打斷成300-800bp長(zhǎng)的小片段,并在片段兩端加上不同的接頭,或?qū)⒋郎y(cè)DNA變性后用雜交引物進(jìn)行PCR擴(kuò)增,連接載體,構(gòu)建單鏈DNA文庫(kù)(圖5a)。

**(2)Emulsion PCR **(乳液PCR,其實(shí)是一個(gè)注水到油的獨(dú)特過程)

454當(dāng)然DNA擴(kuò)增過程也和illumina的截然不同,它將這些單鏈DNA結(jié)合在水油包被的直徑約28um的磁珠上,并在其上面孵育、退火。

乳液PCR最大的特點(diǎn)是可以形成數(shù)目龐大的獨(dú)立反應(yīng)空間以進(jìn)行DNA擴(kuò)增。其關(guān)鍵技術(shù)是“注水到油”(水包油),基本過程是在PCR反應(yīng)前,將包含PCR所有反應(yīng)成分的水溶液注入到高速旋轉(zhuǎn)的礦物油表面,水溶液瞬間形成無數(shù)個(gè)被礦物油包裹的小水滴。這些小水滴就構(gòu)成了獨(dú)立的PCR反應(yīng)空間。理想狀態(tài)下,每個(gè)小水滴只含一個(gè)DNA模板和一個(gè)磁珠。

這些被小水滴包被的磁珠表面含有與接頭互補(bǔ)的DNA序列,因此這些單鏈DNA序列能夠特異地結(jié)合在磁珠上。同時(shí)孵育體系中含有PCR反應(yīng)試劑,所以保證了每個(gè)與磁珠結(jié)合的小片段都能獨(dú)立進(jìn)行PCR擴(kuò)增,并且擴(kuò)增產(chǎn)物仍可以結(jié)合到磁珠上。當(dāng)反應(yīng)完成后,可以破壞孵育體系并將帶有DNA的磁珠富集下來。進(jìn)過擴(kuò)增,每個(gè)小片段都將被擴(kuò)增約100萬倍,從而達(dá)到下一步測(cè)序所要求的DNA量。

(3)焦磷酸測(cè)序

測(cè)序前需要先用一種聚合酶和單鏈結(jié)合蛋白處理帶有DNA的磁珠,接著將磁珠放在一種PTP平板上。這種平板上特制有許多直徑約為44um的小孔,每個(gè)小孔僅能容納一個(gè)磁珠,通過這種方法來固定每個(gè)磁珠的位置,以便檢測(cè)接下來的測(cè)序反應(yīng)過程。

測(cè)序方法采用焦磷酸測(cè)序法,將一種比PTP板上小孔直徑更小的磁珠放入小孔中,啟動(dòng)測(cè)序反應(yīng)。測(cè)序反應(yīng)以磁珠上大量擴(kuò)增出的單鏈DNA為模板,每次反應(yīng)加入一種dNTP進(jìn)行合成反應(yīng)。如果dNTP能與待測(cè)序列配對(duì),則會(huì)在合成后釋放焦磷酸基團(tuán)。釋放的焦磷酸基團(tuán)會(huì)與反應(yīng)體系中的ATP硫酸化學(xué)酶反應(yīng)生成ATP。生成的ATP和熒光素酶共同氧化使測(cè)序反應(yīng)中的熒光素分子并發(fā)出熒光,同時(shí)由PTP板另一側(cè)的CCD照相機(jī)記錄,最后通過計(jì)算機(jī)進(jìn)行光信號(hào)處理而獲得最終的測(cè)序結(jié)果。由于每一種dNTP在反應(yīng)中產(chǎn)生的熒光顏色不同,因此可以根據(jù)熒光的顏色來判斷被測(cè)分子的序列。反應(yīng)結(jié)束后,游離的dNTP會(huì)在雙磷酸酶的作用下降解ATP,從而導(dǎo)致熒光淬滅,以便使測(cè)序反應(yīng)進(jìn)入下一個(gè)循環(huán)。由于454測(cè)序技術(shù)中,每個(gè)測(cè)序反應(yīng)都在PTP板上獨(dú)立的小孔中進(jìn)行,因而能大大降低相互間的干擾和測(cè)序偏差。454技術(shù)最大的優(yōu)勢(shì)在于其能獲得較長(zhǎng)的測(cè)序讀長(zhǎng),當(dāng)前454技術(shù)的平均讀長(zhǎng)可達(dá)400bp,并且454技術(shù)和illumina的Solexa和Hiseq技術(shù)不同,它最主要的一個(gè)缺點(diǎn)是無法準(zhǔn)確測(cè)量同聚物的長(zhǎng)度,如當(dāng)序列中存在類似于PolyA的情況時(shí),測(cè)序反應(yīng)會(huì)一次加入多個(gè)T,而所加入的T的個(gè)數(shù)只能通過熒光強(qiáng)度推測(cè)獲得,這就有可能導(dǎo)致結(jié)果不準(zhǔn)確。也正是由于這一原因,454技術(shù)會(huì)在測(cè)序過程中引入插入和缺失的測(cè)序錯(cuò)誤。


圖8-a

圖8-b

圖8-c

Solid技術(shù)

Solid測(cè)序技術(shù)是ABI公司于2007年開始投入用于商業(yè)測(cè)序應(yīng)用的儀器。它基于連接酶法,即利用DNA連接酶在連接過程之中測(cè)序(圖6)2,4。它的原理是:

圖9-a. Solid測(cè)序技術(shù)

(1)DNA文庫(kù)構(gòu)建
片段打斷并在片段兩端加上測(cè)序接頭,連接載體,構(gòu)建單鏈DNA文庫(kù)。
(2)Emulsion PCR
Solid的PCR過程也和454的方法類似,同樣采用小水滴emulsion PCR,但這些微珠比起454系統(tǒng)來說則要小得多,只有1um。在擴(kuò)增的同時(shí)對(duì)擴(kuò)增產(chǎn)物的3’端進(jìn)行修飾,這是為下一步的測(cè)序過程作的準(zhǔn)備。3’修飾的微珠會(huì)被沉積在一塊玻片上。在微珠上樣的過程中,沉積小室將每張玻片分成1個(gè)、4個(gè)或8個(gè)測(cè)序區(qū)域(圖6-a)。Solid系統(tǒng)最大的優(yōu)點(diǎn)就是每張玻片能容納比454更高密度的微珠,在同一系統(tǒng)中輕松實(shí)現(xiàn)更高的通量。
(3)連接酶測(cè)序
這一步是Solid測(cè)序的獨(dú)特之處。它并沒有采用以前測(cè)序時(shí)所常用的DNA聚合酶,而是采用了連接酶。Solid連接反應(yīng)的底物是8堿基單鏈熒光探針混合物,這里將其簡(jiǎn)單表示為:3’-XXnnnzzz-5’。連接反應(yīng)中,這些探針按照堿基互補(bǔ)規(guī)則與單鏈DNA模板鏈配對(duì)。探針的5’末端分別標(biāo)記了CY5、Texas Red、CY3、6-FAM這4種顏色的熒光染料(圖6-a)。這個(gè)8堿基單鏈熒光探針中,第1和第2位堿基(XX)上的堿基是確定的,并根據(jù)種類的不同在6-8位(zzz)上加上了不同的熒光標(biāo)記。這是Solid的獨(dú)特測(cè)序法,兩個(gè)堿基確定一個(gè)熒光信號(hào),相當(dāng)于一次能決定兩個(gè)堿基。這種測(cè)序方法也稱之為兩堿基測(cè)序法。當(dāng)熒光探針能夠與DNA模板鏈配對(duì)而連接上時(shí),就會(huì)發(fā)出代表第1,2位堿基的熒光信號(hào),圖6-a和圖6-b中的比色版所表示的是第1,2位堿基的不同組合與熒光顏色的關(guān)系。在記錄下熒光信號(hào)后,通過化學(xué)方法在第5和第6位堿基之間進(jìn)行切割,這樣就能移除熒光信號(hào),以便進(jìn)行下一個(gè)位置的測(cè)序。不過值得注意的是,通過這種測(cè)序方法,每次測(cè)序的位置都相差5位。即第一次是第1、2位,第二次是第6、7位……在測(cè)到末尾后,要將新合成的鏈變性,洗脫。接著用引物n-1進(jìn)行第二輪測(cè)序。引物n-1與引物n的區(qū)別是,二者在與接頭配對(duì)的位置上相差一個(gè)堿基(圖6-a. 8)。也即是,通過引物n-1在引物n的基礎(chǔ)上將測(cè)序位置往3’端移動(dòng)一個(gè)堿基位置,因而就能測(cè)定第0、1位和第5、6位……第二輪測(cè)序完成,依此類推,直至第五輪測(cè)序,最終可以完成所有位置的堿基測(cè)序,并且每個(gè)位置的堿基均被檢測(cè)了兩次。該技術(shù)的讀長(zhǎng)在2×50bp,后續(xù)序列拼接同樣比較復(fù)雜。由于雙次檢測(cè),這一技術(shù)的原始測(cè)序準(zhǔn)確性高達(dá)99.94%,而15x覆蓋率時(shí)的準(zhǔn)確性更是達(dá)到了99.999%,應(yīng)該說是目前第二代測(cè)序技術(shù)中準(zhǔn)確性最高的了。但在熒光解碼階段,鑒于其是雙堿基確定一個(gè)熒光信號(hào),因而一旦發(fā)生錯(cuò)誤就容易產(chǎn)生連鎖的解碼錯(cuò)誤。

圖9-b. Solid測(cè)序技術(shù)

第三代測(cè)序技術(shù)

這是一個(gè)新的里程碑。以PacBio公司的SMRT和Oxford Nanopore Technologies的納米孔單分子測(cè)序技術(shù)為標(biāo)志,被稱之為第三代測(cè)序技術(shù)。與前兩代相比,最大的特點(diǎn)就是 單分子測(cè)序,測(cè)序過程無需進(jìn)行PCR擴(kuò)增,超長(zhǎng)讀長(zhǎng),以下圖9是PacBio SMRT技術(shù)的測(cè)序讀長(zhǎng)分布情況,平均達(dá)到10Kb-15Kb,是二代測(cè)序技術(shù)的100倍以上,值得注意的是在測(cè)序過程中這些序列的讀長(zhǎng)也不再是相等的,下文有解析!

PacBio SMRT

PacBio SMRT技術(shù)其實(shí)也應(yīng)用了邊合成邊測(cè)序的思想,并以SMRT芯片為測(cè)序載體(如同flowcell)?;驹硎牵?DNA聚合酶和模板結(jié)合,用4色熒光標(biāo)記A,C,G,T這4種堿基(即是dNTP)。在堿基的配對(duì)階段,不同的堿基加入,會(huì)發(fā)出不同的光,根據(jù)光的波長(zhǎng)與峰值可判斷進(jìn)入的堿基類型。

這個(gè)DNA聚合酶是實(shí)現(xiàn)超長(zhǎng)讀長(zhǎng)的關(guān)鍵之一,讀長(zhǎng)主要跟酶的活性保持有關(guān),它主要受激光對(duì)其造成的損傷所影響。PacBio SMRT技術(shù)的一個(gè)關(guān)鍵點(diǎn)是在于如何將反應(yīng)信號(hào)與周圍游離堿基的強(qiáng)大熒光背景區(qū)別出來。他們利用的是ZMW(零模波導(dǎo)孔)原理:如同微波爐壁上可看到的很多密集小孔。這些小孔的直徑是有嚴(yán)格要求的,如果直徑大于微波波長(zhǎng),能量就會(huì)在衍射效應(yīng)的作用下穿透面板從而泄露出來(光波的衍射效應(yīng)),從而與周圍小孔相互干擾(光波的干涉)。如果孔徑能夠小于波長(zhǎng),那么能量就不會(huì)輻射到周圍,而是保持直線狀態(tài),從而可起到保護(hù)的作用。同理,在一個(gè)反應(yīng)管(SMRTCell:單分子實(shí)時(shí)反應(yīng)孔)中有許多這樣的圓形納米小孔,,即 ZMW(零模波導(dǎo)孔),外徑100多納米,比檢測(cè)激光波長(zhǎng)小(數(shù)百納米),激光從底部打上去后不會(huì)穿透小孔進(jìn)入上方的溶液區(qū),能量會(huì)被限制在一個(gè)小范圍(體積20X 10-21 L)里(圖10-A),正好足夠覆蓋需要檢測(cè)的部分,使得信號(hào)僅僅只是來自于這個(gè)小反應(yīng)區(qū)域,孔外過多的游離核苷酸單體依然留在黑暗中,從而實(shí)現(xiàn)將背景噪音降到最低的目的。

PacBio SMRT技術(shù)除了能夠檢測(cè)普通的堿基之外,還可以通過檢測(cè)相鄰兩個(gè)堿基之間的測(cè)序時(shí)間,來檢測(cè)堿基的表觀修飾情況,如甲基化。因?yàn)榧僭O(shè)某個(gè)堿基存在表觀修飾,則通過聚合酶時(shí)的速度會(huì)減慢,那么相鄰兩峰之間的距離會(huì)增大,我們可以通過這個(gè)時(shí)間上的差異來檢測(cè)表觀甲基化修飾等信息(圖11)。

SMRT技術(shù)的測(cè)序速度很快,每秒約10個(gè)dNTP。但這么快的測(cè)序速度也帶來了一些明顯的缺點(diǎn)——測(cè)序錯(cuò)誤率比較高(這幾乎是目前單分子測(cè)序技術(shù)的通?。梢赃_(dá)到10%-15%,而且以缺失序列和錯(cuò)位居多,但好在它的出錯(cuò)是隨機(jī)的,并不會(huì)像第二代測(cè)序技術(shù)那樣存在一定的堿基偏向,因此可以通過多次測(cè)序來進(jìn)行有效糾錯(cuò)。

Oxford Nanopore

Oxford Nanopore 的MinION是另一個(gè)比較受關(guān)注的第三代測(cè)序儀,俗稱U盤測(cè)序儀,圖12(左)!這家公司開發(fā)的納米單分子測(cè)序技術(shù)與以往的測(cè)序技術(shù)相比都不一樣,它是基于電信號(hào)而不是光信號(hào)的測(cè)序技術(shù)!

這個(gè)技術(shù)的關(guān)鍵點(diǎn)在于他們所設(shè)計(jì)的一種特殊納米孔,孔內(nèi)共價(jià)結(jié)合分子接頭。當(dāng)DNA分子通過納米孔時(shí),它們使電荷發(fā)生變化,從而短暫地影響流過納米孔的電流強(qiáng)度(每種堿基所影響的電流變化幅度是不同的),最后高靈敏度的電子設(shè)備檢測(cè)到這些變化從而鑒定所通過的堿基(圖13)。

納米孔測(cè)序以及其他第三代測(cè)序技術(shù),有可能會(huì)徹底地解決目前第二代測(cè)序平臺(tái)的諸多不足。另外,MinION的主要特點(diǎn)是:讀長(zhǎng)很長(zhǎng),而且比PacBio的都長(zhǎng)得多,基本都是在幾十kb上百kb以上,最新的數(shù)據(jù)顯示可以達(dá)到900 kb!錯(cuò)誤率是5%-15%,也是隨機(jī)錯(cuò)誤,MinION最大的特點(diǎn)除了極小的體積之外,就是數(shù)據(jù)將是可實(shí)時(shí)讀取的,并且起始DNA在測(cè)序過程中不被破壞!這真是個(gè)可以上天的能力。然鵝,遺憾地多說幾句,目前還沒真正公布,細(xì)節(jié)也不知,自從2012開過一次發(fā)布會(huì)之后,就沒什么聲響了。

這種納米孔單分子測(cè)序儀還有另一大特點(diǎn),它能夠 直接 讀取出甲基化的胞嘧啶,而不必像二代測(cè)序方法那樣需要事先對(duì)基因組進(jìn)行bisulfite處理。這對(duì)于在基因組水平直接研究表觀遺傳相關(guān)現(xiàn)象有極大的幫助。下面是對(duì)PacBio和Oxford Nanopore這兩家第三代測(cè)序技術(shù)公司的測(cè)序儀做的一個(gè)簡(jiǎn)單比較,可以看出其實(shí)成本還是蠻高的,質(zhì)量也只是還行,期待他們的下一次進(jìn)化吧。

總結(jié)

測(cè)序技術(shù)的比較-1

測(cè)序技術(shù)的比較-2

以上,便是對(duì)各代測(cè)序技術(shù)的原理做了簡(jiǎn)要的闡述。在這個(gè)比較的過程中,可以看到測(cè)序成本,讀長(zhǎng)和通量是該測(cè)序技術(shù)先進(jìn)與否的三個(gè)重要指標(biāo)。其實(shí)第一代和第二代測(cè)序技術(shù)除了通量和成本上的差異之外,測(cè)序的核心原理都來自于邊合成邊測(cè)序的思想。第二代測(cè)序技術(shù)的優(yōu)點(diǎn)是通量大大提升,成本大大減低,使得昔日王榭堂前燕,可以飛入尋常百姓家??傊挥凶兂砂撞藘r(jià),才能真正對(duì)大眾有意義;但它的缺點(diǎn)是所引入PCR過程會(huì)在一定程度上增加測(cè)序的錯(cuò)誤率,并且具有系統(tǒng)偏向性,同時(shí)讀長(zhǎng)也比較短。第三代測(cè)序技術(shù)是為了解決第二代所存在的缺點(diǎn)而開發(fā)的,它的根本特點(diǎn)是單分子測(cè)序,不需要任何PCR的過程,這是為了能有效避免因PCR偏向性而導(dǎo)致的系統(tǒng)錯(cuò)誤,同時(shí)提高讀長(zhǎng),但這個(gè)技術(shù)還不是很成熟,需要再進(jìn)化,成本也偏高。

參考文獻(xiàn)

  1. Sanger, F. & Nicklen, S. DNA sequencing with chain-terminating. 74, 5463–5467 (1977).
  2. Mardis, E. R. Next-generation DNA sequencing methods. Annual review of genomics and human genetics 9, 387–402 (2008).
  3. Shendure, J. & Ji, H. Next-generation DNA sequencing. Nature biotechnology 26, 1135–45 (2008).
  4. Metzker, M. L. Sequencing technologies - the next generation. Nature reviews. Genetics 11, 31–46 (2010).
  5. Niedringhaus, T. P., Milanova, D., Kerby, M. B., Snyder, M. P. & Barron, A. E. Landscape of Next-Generation Sequencing Technologies. 4327–4341 (2011).
  6. Rothberg, J. M. et al. An integrated semiconductor device enabling non-optical genome sequencing. Nature 475, 348–52 (2011).

原文:

http://www.huangshujia.me/2017/08/04/2017-08-04-Begining-WGS-Data-Analysis-Sequecing-Tech.html
https://blog.csdn.net/dyllove98/article/details/9736441

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容