從1977年第一代DNA測序技術(shù)(Sanger法)1,發(fā)展至今三十多年時間,測序技術(shù)已取得了相當大的發(fā)展,從第一代到第三代乃至第四代,測序讀長從長到短,再從短到長。
第一代測序技術(shù)
第一代DNA測序技術(shù)用的是1975年由桑格(Sanger)和考爾森(Coulson)開創(chuàng)的鏈終止法或者是1976-1977年由馬克西姆(Maxam)和吉爾伯特(Gilbert)發(fā)明的化學法(鏈降解). 并在1977年,桑格測定了第一個基因組序列,是噬菌體X174的,全長5375個堿基1。自此,人類獲得了窺探生命遺傳差異本質(zhì)的能力,并以此為開端步入基因組學時代。研究人員在Sanger法的多年實踐之中不斷對其進行改進。在2001年,完成的首個人類基因組圖譜就是以改進了的Sanger法為其測序基礎(chǔ),Sanger法核心原理是:由于ddNTP的2’和3’都不含羥基,其在DNA的合成過程中不能形成磷酸二酯鍵,因此可以用來中斷DNA合成反應(yīng),在4個DNA合成反應(yīng)體系中分別加入一定比例帶有放射性同位素標記的ddNTP(分為:ddATP,ddCTP,ddGTP和ddTTP),通過凝膠電泳和放射自顯影后可以根據(jù)電泳帶的位置確定待測分子的DNA序列
第二代測序技術(shù)
總的說來,第一代測序技術(shù)的主要特點是測序讀長可達1000bp,準確性高達99.999%,但其測序成本高,通量低等方面的缺點,嚴重影響了其真正大規(guī)模的應(yīng)用。因而第一代測序技術(shù)并不是最理想的測序方法。經(jīng)過不斷的技術(shù)開發(fā)和改進,以Roche公司的454技術(shù)、illumina公司的Solexa,Hiseq技術(shù)和ABI公司的Solid技術(shù)為標記的第二代測序技術(shù)誕生了。第二代測序技術(shù)大大降低了測序成本的同時,還大幅提高了測序速度,并且保持了高準確性,以前完成一個人類基因組的測序需要3年時間,而使用二代測序技術(shù)則僅僅需要1周,但在序列讀長方面比起第一代測序技術(shù)則要短很多。
Illumine
Illumina公司的Solexa和Hiseq應(yīng)該說是目前全球使用量最大的第二代測序機器,這兩個系列的技術(shù)核心原理是相同的2,4。這兩個系列的機器采用的都是邊合成邊測序的方法,它的測序過程主要分為以下4步,
########(1)DNA待測文庫構(gòu)建
利用超聲波把待測的DNA樣本打斷成小片段,目前除了組裝之外和一些其他的特殊要求之外,主要是打斷成200-500bp長的序列片段,并在這些小片段的兩端添加上不同的接頭,構(gòu)建出單鏈DNA文庫。
########(2)Flowcell
Flowcell是用于吸附流動DNA片段的槽道,當文庫建好后,這些文庫中的DNA在通過flowcell的時候會隨機附著在flowcell表面的channel上。每個Flowcell有8個channel,每個channel的表面都附有很多接頭,這些接頭能和建庫過程中加在DNA片段兩端的接頭相互配對(這就是為什么flowcell能吸附建庫后的DNA的原因),并能支持DNA在其表面進行橋式PCR的擴增。
########(3)橋式PCR擴增與變性
橋式PCR以Flowcell表面所固定的接頭為模板,進行橋形擴增,如圖4.a所示。經(jīng)過不斷的擴增和變性循環(huán),最終每個DNA片段都將在各自的位置上集中成束,每一個束都含有單個DNA模板的很多分拷貝,進行這一過程的目的在于實現(xiàn)將堿基的信號強度放大,以達到測序所需的信號要求。
########(4)測序
測序方法采用邊合成邊測序的方法。向反應(yīng)體系中同時添加DNA聚合酶、接頭引物和帶有堿基特異熒光標記的4中dNTP(如同Sanger測序法)。這些dNTP的3’-OH被化學方法所保護,因而每次只能添加一個dNTP。在dNTP被添加到合成鏈上后,所有未使用的游離dNTP和DNA聚合酶會被洗脫掉。接著,再加入激發(fā)熒光所需的緩沖液,用激光激發(fā)熒光信號,并有光學設(shè)備完成熒光信號的記錄,最后利用計算機分析將光學信號轉(zhuǎn)化為測序堿基。這樣熒光信號記錄完成后,再加入化學試劑淬滅熒光信號并去除dNTP 3’-OH保護基團,以便能進行下一輪的測序反應(yīng)。Illumina的這種測序技術(shù)每次只添加一個dNTP的特點能夠很好的地解決同聚物長度的準確測量問題,它的主要測序錯誤來源是堿基的替換,目前它的測序錯誤率在1%-1.5%之間,測序周期以人類基因組重測序為例,30x測序深度大約為1周。
2.Roche 454
Roche 454測序系統(tǒng)是第一個商業(yè)化運營二代測序技術(shù)的平臺。它的主要測序原理是(圖5 abc)2:
(1)DNA文庫制備
454測序系統(tǒng)的文件構(gòu)建方式和illumina的不同,它是利用噴霧法將待測DNA打斷成300-800bp長的小片段,并在片段兩端加上不同的接頭,或?qū)⒋郎yDNA變性后用雜交引物進行PCR擴增,連接載體,構(gòu)建單鏈DNA文庫(圖5a)。
(2)Emulsion PCR (乳液PCR,其實是一個注水到油的獨特過程)
454當然DNA擴增過程也和illumina的截然不同,它將這些單鏈DNA結(jié)合在水油包被的直徑約28um的磁珠上,并在其上面孵育、退火。
乳液PCR最大的特點是可以形成數(shù)目龐大的獨立反應(yīng)空間以進行DNA擴增。其關(guān)鍵技術(shù)是“注水到油”(水包油),基本過程是在PCR反應(yīng)前,將包含PCR所有反應(yīng)成分的水溶液注入到高速旋轉(zhuǎn)的礦物油表面,水溶液瞬間形成無數(shù)個被礦物油包裹的小水滴。這些小水滴就構(gòu)成了獨立的PCR反應(yīng)空間。理想狀態(tài)下,每個小水滴只含一個DNA模板和一個磁珠。
這些被小水滴包被的磁珠表面含有與接頭互補的DNA序列,因此這些單鏈DNA序列能夠特異地結(jié)合在磁珠上。同時孵育體系中含有PCR反應(yīng)試劑,所以保證了每個與磁珠結(jié)合的小片段都能獨立進行PCR擴增,并且擴增產(chǎn)物仍可以結(jié)合到磁珠上。當反應(yīng)完成后,可以破壞孵育體系并將帶有DNA的磁珠富集下來。進過擴增,每個小片段都將被擴增約100萬倍,從而達到下一步測序所要求的DNA量。
(3)焦磷酸測序
測序前需要先用一種聚合酶和單鏈結(jié)合蛋白處理帶有DNA的磁珠,接著將磁珠放在一種PTP平板上。這種平板上特制有許多直徑約為44um的小孔,每個小孔僅能容納一個磁珠,通過這種方法來固定每個磁珠的位置,以便檢測接下來的測序反應(yīng)過程。
測序方法采用焦磷酸測序法,將一種比PTP板上小孔直徑更小的磁珠放入小孔中,啟動測序反應(yīng)。測序反應(yīng)以磁珠上大量擴增出的單鏈DNA為模板,每次反應(yīng)加入一種dNTP進行合成反應(yīng)。如果dNTP能與待測序列配對,則會在合成后釋放焦磷酸基團。釋放的焦磷酸基團會與反應(yīng)體系中的ATP硫酸化學酶反應(yīng)生成ATP。生成的ATP和熒光素酶共同氧化使測序反應(yīng)中的熒光素分子并發(fā)出熒光,同時由PTP板另一側(cè)的CCD照相機記錄,最后通過計算機進行光信號處理而獲得最終的測序結(jié)果。由于每一種dNTP在反應(yīng)中產(chǎn)生的熒光顏色不同,因此可以根據(jù)熒光的顏色來判斷被測分子的序列。反應(yīng)結(jié)束后,游離的dNTP會在雙磷酸酶的作用下降解ATP,從而導致熒光淬滅,以便使測序反應(yīng)進入下一個循環(huán)。由于454測序技術(shù)中,每個測序反應(yīng)都在PTP板上獨立的小孔中進行,因而能大大降低相互間的干擾和測序偏差。454技術(shù)最大的優(yōu)勢在于其能獲得較長的測序讀長,當前454技術(shù)的平均讀長可達400bp,并且454技術(shù)和illumina的Solexa和Hiseq技術(shù)不同,它最主要的一個缺點是無法準確測量同聚物的長度,如當序列中存在類似于PolyA的情況時,測序反應(yīng)會一次加入多個T,而所加入的T的個數(shù)只能通過熒光強度推測獲得,這就有可能導致結(jié)果不準確。也正是由于這一原因,454技術(shù)會在測序過程中引入插入和缺失的測序錯誤。
3.Solid技術(shù)
Solid測序技術(shù)是ABI公司于2007年開始投入用于商業(yè)測序應(yīng)用的儀器。它基于連接酶法,即利用DNA連接酶在連接過程之中測序。它的原理是:
(1)DNA文庫構(gòu)建
片段打斷并在片段兩端加上測序接頭,連接載體,構(gòu)建單鏈DNA文庫。
(2)Emulsion PCR
Solid的PCR過程也和454的方法類似,同樣采用小水滴emulsion PCR,但這些微珠比起454系統(tǒng)來說則要小得多,只有1um。在擴增的同時對擴增產(chǎn)物的3’端進行修飾,這是為下一步的測序過程作的準備。3’修飾的微珠會被沉積在一塊玻片上。在微珠上樣的過程中,沉積小室將每張玻片分成1個、4個或8個測序區(qū)域。Solid系統(tǒng)最大的優(yōu)點就是每張玻片能容納比454更高密度的微珠,在同一系統(tǒng)中輕松實現(xiàn)更高的通量。
#######(3)連接酶測序
這一步是Solid測序的獨特之處。它并沒有采用以前測序時所常用的DNA聚合酶,而是采用了連接酶。Solid連接反應(yīng)的底物是8堿基單鏈熒光探針混合物,這里將其簡單表示為:3’-XXnnnzzz-5’。連接反應(yīng)中,這些探針按照堿基互補規(guī)則與單鏈DNA模板鏈配對。探針的5’末端分別標記了CY5、Texas Red、CY3、6-FAM這4種顏色的熒光染料。這個8堿基單鏈熒光探針中,第1和第2位堿基(XX)上的堿基是確定的,并根據(jù)種類的不同在6-8位(zzz)上加上了不同的熒光標記。這是Solid的獨特測序法,兩個堿基確定一個熒光信號,相當于一次能決定兩個堿基。這種測序方法也稱之為兩堿基測序法。當熒光探針能夠與DNA模板鏈配對而連接上時,就會發(fā)出代表第1,2位堿基的熒光信號,圖6-a和圖6-b中的比色版所表示的是第1,2位堿基的不同組合與熒光顏色的關(guān)系。在記錄下熒光信號后,通過化學方法在第5和第6位堿基之間進行切割,這樣就能移除熒光信號,以便進行下一個位置的測序。不過值得注意的是,通過這種測序方法,每次測序的位置都相差5位。即第一次是第1、2位,第二次是第6、7位……在測到末尾后,要將新合成的鏈變性,洗脫。接著用引物n-1進行第二輪測序。引物n-1與引物n的區(qū)別是,二者在與接頭配對的位置上相差一個堿基。也即是,通過引物n-1在引物n的基礎(chǔ)上將測序位置往3’端移動一個堿基位置,因而就能測定第0、1位和第5、6位……第二輪測序完成,依此類推,直至第五輪測序,最終可以完成所有位置的堿基測序,并且每個位置的堿基均被檢測了兩次。該技術(shù)的讀長在2×50bp,后續(xù)序列拼接同樣比較復雜。由于雙次檢測,這一技術(shù)的原始測序準確性高達99.94%,而15x覆蓋率時的準確性更是達到了99.999%,應(yīng)該說是目前第二代測序技術(shù)中準確性最高的了。但在熒光解碼階段,鑒于其是雙堿基確定一個熒光信號,因而一旦發(fā)生錯誤就容易產(chǎn)生連鎖的解碼錯誤。
第三代測序技術(shù)
測序技術(shù)在近兩三年中又有新的里程碑。以PacBio公司的SMRT和Oxford Nanopore Technologies納米孔單分子測序技術(shù),被稱之為第三代測序技術(shù)。與前兩代相比,他們最大的特點就是單分子測序,測序過程無需進行PCR擴增。
基本原理是: DNA聚合酶和模板結(jié)合,4色熒光標記 4 種堿基(即是dNTP),在堿基配對階段,不同堿基的加入,會發(fā)出不同光,根據(jù)光的波長與峰值可判斷進入的堿基類型。同時這個 DNA 聚合酶是實現(xiàn)超長讀長的關(guān)鍵之一,讀長主要跟酶的活性保持有關(guān),它主要受激光對其造成的損傷所影響。PacBio SMRT技術(shù)的一個關(guān)鍵是怎樣將反應(yīng)信號與周圍游離堿基的強大熒光背景區(qū)別出來。他們利用的是ZMW(零模波導孔)原理:如同微波爐壁上可看到的很多密集小孔。小孔直徑有考究,如果直徑大于微波波長,能量就會在衍射效應(yīng)的作用下穿透面板而泄露出來,從而與周圍小孔相互干擾。如果孔徑小于波長,能量不會輻射到周圍,而是保持直線狀態(tài)(光衍射的原理),從而可起保護作用。同理,在一個反應(yīng)管(SMRTCell:單分子實時反應(yīng)孔)中有許多這樣的圓形納米小孔, 即 ZMW(零模波導孔),外徑 100多納米,比檢測激光波長小(數(shù)百納米),激光從底部打上去后不能穿透小孔進入上方溶液區(qū),能量被限制在一個小范圍(體積20X 10-21 L)里,正好足夠覆蓋需要檢測的部分,使得信號僅來自這個小反應(yīng)區(qū)域,孔外過多游離核苷酸單體依然留在黑暗中,從而實現(xiàn)將背景降到最低。另外,可以通過檢測相鄰兩個堿基之間的測序時間,來檢測一些堿基修飾情況,既如果堿基存在修飾,則通過聚合酶時的速度會減慢,相鄰兩峰之間的距離增大,可以通過這個來之間檢測甲基化等信息。SMRT技術(shù)的測序速度很快,每秒約10個dNTP。但是,同時其測序錯誤率比較高(這幾乎是目前單分子測序技術(shù)的通?。?,達到15%,但好在它的出錯是隨機的,并不會像第二代測序技術(shù)那樣存在測序錯誤的偏向,因而可以通過多次測序來進行有效的糾錯。
