一、二、三、四代測序技術(shù)原理詳解

測序技術(shù)是基因組學(xué)的核心技術(shù),上期的推送【LAI:基因組組裝質(zhì)量評估新標(biāo)準(zhǔn)】簡單介紹了測序技術(shù)的發(fā)展進(jìn)程。其實(shí),測序技術(shù)的發(fā)展主要基于兩個非常具有里程碑意義的理念:“生命是序列的”和“生命是數(shù)據(jù)的”。序列是基因組學(xué)最基本最重要的數(shù)據(jù),也是生命科學(xué)領(lǐng)域大數(shù)據(jù)時代的核心組成部分。簡單來說,測序技術(shù)就是將DNA/RNA分子中堿基ATGC的排列順序顯示出來。

1953年,Watson和Crick提出DNA雙螺旋結(jié)構(gòu)。

DNA雙螺旋模型以及“生命是序列的”觀點(diǎn)的發(fā)表,直接推動了測序技術(shù)的發(fā)展,因為解讀生命遺傳信息的前提就是得到它的載體——序列。

從20世紀(jì)70年代到現(xiàn)在有很多測序技術(shù)和平臺的產(chǎn)生,其中包括SBC法、454、Ion Torrent、SBL法、Sanger法、Illumina、Pacbio、Nanopore等。今天主要跟大家分享后四種常用的測序技術(shù)。

第一代測序技術(shù)

Sanger法是基于DNA合成反應(yīng)的測序技術(shù),又稱為SBS法、末端終止法。1975年由Sanger提出,并于1977發(fā)表第一個完整的生物體基因組序列。

核心原理:由于雙脫氧核苷酸(ddNTP)的3’位置脫氧,其在DNA的合成過程中不能形成磷酸二酯鍵,因此可以用來中斷DNA合成反應(yīng),在4個DNA合成反應(yīng)體系中分別加入一定比例帶有放射性同位素標(biāo)記的ddNTP(分為:ddATP,ddCTP,ddGTP和ddTTP),通過凝膠電泳和放射自顯影,根據(jù)電泳帶的位置確定待測分子的DNA序列。

在每個反應(yīng)體系中,ddNTP相對于dNTP是很少的,所以只有部分新鏈在不同的位置特異性終止,最終就會得到一系列長度不一的序列。

第二代測序技術(shù)

以Illumina平臺為代表的第二代測序技術(shù)實(shí)現(xiàn)了高通量測序,有了革命性進(jìn)展,使得大規(guī)模并行測序成為現(xiàn)實(shí),極大推動了生命科學(xué)領(lǐng)域基因組學(xué)的發(fā)展。Illumina循環(huán)SBS法(cycle SBS)即SBRT(Sequencing By Reversible Termination,可逆終止)的核心技術(shù)是DNA合成的可逆性末端循環(huán),即3'-OH可逆性的修飾和去修飾。

基本原理:將dNTP的3'-OH以疊氮集團(tuán)RTG(Reversible Terminating Group,可逆末端基團(tuán))進(jìn)行修飾;將4種堿基分別與不同的熒光分子連接;DNA合成時,RTG能起到類似于ddNTP的作用終止反應(yīng);每次合成反應(yīng)終止并讀取信號之后,洗脫RTG和熒光分子,進(jìn)行下一輪循環(huán)。

主要過程:

a, DNA待測文庫構(gòu)建

利用超聲波把待測的DNA樣本打斷成小片段,并在這些小片段的兩端添加上不同的接頭,構(gòu)建出單鏈DNA文庫。這些文庫中的DNA在通過flowcell(吸附流動DNA片段的槽道)時會隨機(jī)附著在flowcell表面的channel上。每個Flowcell有8個channel,每個channel的表面都附有很多接頭,這些接頭能和建庫過程中加在DNA片段兩端的接頭相互配對,并能支持DNA在其表面進(jìn)行橋式PCR的擴(kuò)增。

b,c 橋式PCR以Flowcell表面所固定的接頭為模板,進(jìn)行橋形擴(kuò)增。經(jīng)過不斷的擴(kuò)增和變性循環(huán),最終每個DNA片段都將在各自的位置上集中成束,每一個束都含有單個DNA模板的很多份拷貝,進(jìn)行這一過程的目的在于實(shí)現(xiàn)將堿基信號強(qiáng)度放大,以達(dá)到測序所需的信號要求。

測序方法采用邊合成邊測序的方法:

1. dNTP模型

2. dNTP加上可終止反應(yīng)的基團(tuán)RTG和熒光信號

3.?反應(yīng)體系中同時添加DNA聚合酶、接頭引物和帶有堿基特異熒光標(biāo)記的4種dNTP

4. 脫掉-OH和二磷酸,進(jìn)行合成

5. 反應(yīng)因RTG終止,激發(fā)熒光進(jìn)行信號采集。

6. 洗脫RTG和熒光分子,進(jìn)行下一輪循環(huán)

第三代測序技術(shù)

以Pacbio平臺為代表的SMRT(Single-Molecule Real Time Sequencing,單分子實(shí)時測序)測序技術(shù)具有高通量、長讀長的特點(diǎn)。

基本原理:Pacbio仍然采用邊合成邊測序的原理,但實(shí)現(xiàn)了兩個重要的技術(shù)突破。一個是將熒光分子標(biāo)記在磷酸上,這樣在反應(yīng)停止且捕獲熒光信號以后,可直接隨磷酸基團(tuán)脫落,解決了因噪音污染導(dǎo)致的讀長很短的問題;二是由于不需要PCR擴(kuò)增,信號的有效提取成為了關(guān)鍵。通過引入零模波導(dǎo)孔(ZMW)技術(shù)解決這一問題。在納米室底部有一個孔徑70nm的小孔,由于遠(yuǎn)遠(yuǎn)小于激光的波長,所以激光從底部照射時,只會照亮一個小的區(qū)域,提高了信噪比。

主要過程:如下圖所示,類似于Illumina部分展示的模式圖,也是邊合成邊測序。

第四代測序技術(shù)

納米孔測序技術(shù)是單分子實(shí)時測序的新一代技術(shù),主要是通過ssDNA或RNA模板分子通過納米孔而帶來的“電信號”變化推測堿基組成進(jìn)行實(shí)時測序。

基本原理:當(dāng)納米孔充滿導(dǎo)電液時,兩端加上一定電壓,分子模板通過納米孔生成可測量電流。納米孔的直徑只能容納一個核苷酸,單鏈模板就會在電場作用下依次通過納米孔而引起電流強(qiáng)度變化,通過檢測相應(yīng)的電流峰判斷堿基,實(shí)現(xiàn)實(shí)時測序。

四大測序技術(shù)的優(yōu)缺點(diǎn):

Sanger法測序讀長長、準(zhǔn)確度高,但是通量不高;

Illumina測序讀長短、通量高、準(zhǔn)確度高,在進(jìn)行基因組組裝或者結(jié)構(gòu)變異分析的時候沒有優(yōu)勢,可用作三四代測序read的糾錯;

Pacbio測序讀長長、通量高、準(zhǔn)確度不高,但可通過測序深度彌補(bǔ),GC偏差低,可進(jìn)行甲基化的直接測序。

Nanopore測序讀長長、通量高、準(zhǔn)確度低,不可通過測序深度彌補(bǔ),但可通過Illumina read 糾錯。

第一、二、三代測序技術(shù)都是基于邊合成邊測序的原理,因此Nanopore技術(shù)被一些人(包括我)稱為第四代測序技術(shù);

隨著測序技術(shù)的發(fā)展和成熟,逐漸形成基因測序產(chǎn)業(yè)鏈

本期對于測序技術(shù)的介紹到此為止,主要是同大家交流學(xué)習(xí),歡迎指出不足之處。另外推薦一本2016年出版的楊煥明院士的《基因組學(xué)》,非常好的一本書。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容