常用測序機(jī)器及其原理-1(自學(xué)用)

常用的測序機(jī)器包括Sanger測序、二代測序(如Illumina測序)三代測序(如PacBio和Nanopore測序)

1. Sanger測序(第一代測序,雙脫氧法測序)

原理:Sanger測序使用特定的堿基終止反應(yīng)。即在DNA合成過程中加入了少量的鏈終止核苷酸(ddNTPs),這些核苷酸一旦加入到DNA鏈中,就會(huì)阻止鏈的延伸,產(chǎn)生不同長度的DNA片段。每種堿基(A、T、C、G)都帶有不同的熒光標(biāo)簽,通過電泳分離并讀取熒光信號(hào),可以確定DNA序列。


ddNTPs



就像是失去可一條胳膊的人一樣不能去拉下一個(gè)人的手

設(shè)置四個(gè)反應(yīng)體系1-4,分別加入引物、DNA聚合酶、四種dNTP、一定比例的ddNTP(帶有放射性標(biāo)記)例如1中是ddATP,它就負(fù)責(zé)測定T堿基的位置;依次2是ddCTP,3是ddTTP, 4是ddGTP。假如擴(kuò)增過程中ddATP遇到了T位點(diǎn),就結(jié)合并終止(因?yàn)閐dNTP的2‘和3'都沒有羥基),一段時(shí)間內(nèi)大量的ddNTP會(huì)結(jié)合完所有測序位點(diǎn)。最后利用凝膠電泳和放射自顯影只能看到帶有熒光標(biāo)記的ddNTP,他們的排列順序先利用電泳條帶前后關(guān)系確定下,再用A-T, T-A, C-G, G-C關(guān)系反轉(zhuǎn)一下,就能知道我們的測序序列。

測序過程

一代測序技術(shù)的主要特點(diǎn)就是測序讀長可達(dá)1000bp,準(zhǔn)確性高達(dá)99.999%,二三代所不能及),但它的通量低,成本高。目前一代測序在驗(yàn)證序列(就是平時(shí)送公司測序返回來自己blast的那些)以及驗(yàn)證基因組組裝完整性方面都是金標(biāo)準(zhǔn)。


峰越高,越尖,與別的峰交錯(cuò)越少,則表示這個(gè)堿基判讀準(zhǔn)確性越好


2. 二代測序

2.1 Illumina

Roche公司的454技術(shù)、illumina公司的Solexa/Hiseq技術(shù)和ABI公司的SOLID技術(shù)標(biāo)志第二代測序技術(shù)誕生。其中Roche公司的454測序系統(tǒng)是第二代測序技術(shù)中第一個(gè)商業(yè)化運(yùn)營的測序平臺(tái)。

其中Illumina市場規(guī)模占到75%以上,主要包括Miseq,Hiseq。下面??就主要介紹它的PE(Pair End雙端)測序原理:


2.1.1 名詞:

flowcell: 測序反應(yīng)的載體/容器,1個(gè)flowcell有8個(gè)lane


flow cell (流動(dòng)池)宏觀結(jié)構(gòu)(載玻片大?。?/div>

lane: 測序反應(yīng)的平行泳道,其內(nèi)表面是做了專門的化學(xué)修飾(共價(jià)鍵連接)的(將2種DNA引物種在玻璃表面,與測序的接頭序列相互補(bǔ)),試劑添加、洗脫等過程的發(fā)生位置


flowcell微觀結(jié)構(gòu)

DNA引物種在玻璃表面,與測序的接頭序列相互補(bǔ)

DNA引物通過共價(jià)鍵在玻璃表面,與測序的接頭序列相互補(bǔ)

雙端測序: 可能序列比較長有四五百bp,兩邊各測120-150bp

junction: 雙端測序中間一些沒有測到的區(qū)域

index(barcode):一個(gè)lane通常要測多個(gè)樣品,每個(gè)樣品都加上特定的序列標(biāo)簽,用于區(qū)分不同樣品。

flowcell構(gòu)造:一個(gè)lane包含兩列(swath),每一列有60個(gè)tile,每個(gè)tile會(huì)種下不同的cluster,每個(gè)tile在一次循環(huán)中會(huì)拍照4次(每個(gè)堿基一次)

2.1.2 文庫構(gòu)建

1.超聲斷裂

DNA超聲斷裂成小的片段

2. 平末端

打斷以后會(huì)出現(xiàn)末端不平整的情況,用酶補(bǔ)平,所以現(xiàn)在的序列是。


3. 3’ 端加A 尾(Klenow酶)

4. 連接酶連接特定接頭


文庫構(gòu)建完成 Library

2.1.3 橋式PCR

將已經(jīng)構(gòu)建好的文庫,種到芯片上去,然后進(jìn)行擴(kuò)增的一個(gè)過程

1.加入DNA文庫,形成與芯片引物結(jié)合狀態(tài)

2.加入d NTP和聚合酶,合成新的DNA


3.加入NaOH溶液。解離DNA雙鏈


4. 沒有和芯片共價(jià)(原來的鏈)的DNA單鏈解離沖走


5. 加入中性溶液,形成橋接

互補(bǔ)鏈的p7‘和lane上的p7互補(bǔ)(但還是一個(gè)lane中的)就像下圖這樣(摘自illumina官網(wǎng))目的是快速擴(kuò)增lane p7接頭連接的鏈,也就是下圖中的Forward Strand,它和我們的模版鏈?zhǔn)且恢碌摹N覀兒髞頊y序只用這一半。


6. 加入dNTP和聚合酶,形成橋狀DNA


7. 加入NaOH溶液,解離DNA



8. 重復(fù)加入中和液,NaOH,形成cluster


cluster

9. 解鏈:?

橋式PCR完成后,形成了很多的橋形的互補(bǔ)雙鏈,再次強(qiáng)堿解鏈。這一次不再進(jìn)行復(fù)制,而是利用一種酶--甲酰胺基嘧啶糖苷酶(Fpg)選擇性的切掉lane 上p5‘ 連接的鏈,只留下了與lane p7連接的鏈即Forward Strand。


Forward Strand

2.1.4 目標(biāo) RNA 測序


特殊的dNTP的3‘ 羥基被疊氮基團(tuán)替代


測序流程

1.先是primer結(jié)合到靠近p5的sequencing primer binding site1上,再加入特殊的dNTP【它的3‘ 羥基被疊氮基團(tuán)替代,因此每次只能添加一個(gè)dNTP;還含有熒光基團(tuán),能激發(fā)不同顏色】;

2.在dNTP被添加到合成鏈上后,所有未使用的游離dNTP和DNA聚合酶會(huì)被洗脫掉;再加入激發(fā)熒光緩沖液,用激光激發(fā)熒光信號(hào),光學(xué)設(shè)備記錄熒光信號(hào)的記錄,計(jì)算機(jī)將光學(xué)信號(hào)轉(zhuǎn)化為測序堿基,這一個(gè)循環(huán)就能測定flowcell上成千上萬的cluster,這就實(shí)現(xiàn)了高通量。

3.再加入化學(xué)試劑淬滅熒光信號(hào)并使dNTP 3’ 疊氮基團(tuán)變成羥基,這樣能繼續(xù)向下進(jìn)行再加一個(gè),并且保證這個(gè)不再發(fā)出熒光。如此重復(fù)直至所有鏈的堿基序列被檢測出。得到了Forward Strand序列。

4.因?yàn)橐粋€(gè)cluster的序列是一樣的,所以理論上cluster的熒光顏色應(yīng)該一致。

2.1.5 index測序

上面的循環(huán)結(jié)束后,read product被沖掉,index1 primer和鏈上的index1 互補(bǔ)配對(duì),進(jìn)行index1的檢測。測完后,洗脫產(chǎn)物,得到index1 的序列。接下來p5與lane上的p5‘配對(duì),測得了index2,并洗脫。


2.1.6??雙端測序之Reverse Strand

洗脫掉index2 產(chǎn)物后,還是一個(gè)橋式擴(kuò)增,得到雙鏈,再變性得到原始Forward strand 和 新的Reverse Strand, 除去測完的Forward strand。然后和測Forward一樣,也是先連接primer,只是連接的位點(diǎn)是Primer Binding Site2,測完后得到reverse strand序列。


Forward strand 用酶切除
Reverse Strand 測序

思考?
為什么Illumina測序會(huì)有長度限制呢?

1.測序時(shí),經(jīng)過長時(shí)間的PCR,會(huì)有不同步的情況。通俗一點(diǎn)講,比如一開始1個(gè)cluster中是100個(gè)完全一樣的DNA鏈,但是經(jīng)過1輪增加堿基,其中99個(gè)都加入了1個(gè)堿基,顯示了紅色,另外1個(gè)沒有加入堿基,不顯示顏色。這時(shí)候整體為紅色,我們可以順利得到結(jié)果。隨后,在第2輪再加入堿基進(jìn)行合成的時(shí)候,就變成了,之前沒有加入的加入了1個(gè)堿基顯示紅色,剩下的99個(gè)顯示綠色,這個(gè)時(shí)候就會(huì)出現(xiàn)雜信號(hào)。當(dāng)測序長度不斷延長,這個(gè)雜信號(hào)會(huì)越來越多,最后很有可能出現(xiàn),50個(gè)紅,50個(gè)綠色,這時(shí)候我們判斷不出來到底是什么堿基被合成。

2.測序過程中,使用的堿基是特殊處理的,有一個(gè)非常大的熒光基團(tuán)修飾。在使用DNA ploymerase的時(shí)候,酶的狀態(tài)也會(huì)受到底物的影響,越來越差。

數(shù)據(jù)產(chǎn)生??

Hiseq2000測序儀

測序儀搭配了兩個(gè)flowcell,簡稱雙流動(dòng)槽。比較經(jīng)典的Hiseq2500一次能產(chǎn)出700-800Gb數(shù)據(jù)(此處Gb為測序堿基數(shù),不同于字節(jié)數(shù)的Gb)

數(shù)據(jù)量=單端reads長度 * 單端reads個(gè)數(shù) * 2(PE)

測序深度=數(shù)據(jù)量大小/ 參考基因組大小

參考資料:【陳巍學(xué)基因】視頻25:第一代DNA測序_嗶哩嗶哩_bilibili

參考資料:測序原理:一代二代三代測序原理詳解 - 簡書

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容