全基因合成方法

全基因合成是指在體外利用人工方法合成雙鏈DNA分子的技術(shù)?;蚝铣蔁o需模板,是獲取基因的重要手段之一。目前該技術(shù)主要應(yīng)用在克隆一些不易獲取模板的基因、自然界不存在的新基因以及異源基因表達(dá)上,經(jīng)常在對(duì)基因密碼子優(yōu)化后進(jìn)行。密碼子優(yōu)化的必要性及方法,已經(jīng)在前面的文章中介紹,想要回顧的點(diǎn)這里密碼子優(yōu)化。

全基因合成技術(shù)很成熟,一般的做法是:設(shè)計(jì)合成相互重疊的單鏈寡核苷酸,通過重疊延伸PCR法拼接出全長。關(guān)于全基因合成方法的資料網(wǎng)上一大堆,單全基因合成的相關(guān)專利都上百篇,常見的有重疊延伸PCR(OE-PCR)法[1,7],雙不對(duì)稱PCR(DA-PCR)法[2],聚合酶連反應(yīng)(PCR)法[3],連接酶鏈反應(yīng)(LCR)法[4],熱力學(xué)平衡由內(nèi)向外(TBIO)法[5],PCR介導(dǎo)兩步(PTDS)法[6]。說實(shí)話我并沒有仔細(xì)研究這些方法,它們叫什么名字不重要,萬變不離其宗:PCR,基于一定重疊的短引物通過聚合酶逐漸延伸成長片段。

全基因合成最簡單的方法是什么?

當(dāng)然是讓DNA合成公司來合成,我們只需要提供DNA序列信息,他們會(huì)合成dsDNA并克隆在通用載體上,一般還提供測(cè)序信息,確保合成的正確性。這無疑是最簡單、最省事的方法。而且現(xiàn)在全基因合成十分廉價(jià),1bp不到一塊錢還帶測(cè)序的那種。

既然DNA合成公司那么方便,為什么還要自己合成呢?

① 公司合成慢,一般需要1-2周,如果碰到特殊序列比如對(duì)大腸桿菌毒性極大的編碼序列,那周期就難說了(我做過一個(gè)核酸酶,合成公司一個(gè)月沒搞定,自己合成一周搞定)。

② 不自由,合成公司提供的一般是攜帶目標(biāo)基因的重組載體,拿到后還要用酶切切下來,如果基因內(nèi)部含有酶切位點(diǎn)還需要避開,當(dāng)然這些一般不是什么大問題,但你確實(shí)沒得選。

③ 如前所述,全基因合成一般用于異源基因表達(dá),異源表達(dá)的對(duì)象大多是酶,研究酶的性質(zhì)可能又需要構(gòu)建大量突變體。合成公司只提供一個(gè)序列,構(gòu)建突變體還得自己設(shè)計(jì)引物重新構(gòu)建,如果自己合成全基因,只需要將包含突變的引物替換掉,就可以同時(shí)獲得各類突變體,這在構(gòu)建含大量突變的突變體時(shí),更有優(yōu)勢(shì)。

④ 序列需要保密,畢竟自己才最可靠。

總有人喜歡自己動(dòng)手豐衣足食,本文我要介紹的是自己合成的方法,介紹兩種方法:

1 基于“搭橋”PCR的一次拼接法

這種方法依賴于引物間的相互退火,彼此作為模板相互延伸,因此需要的引物總是一正一反。首先把全基因序列打斷為短的oligos,一般不大于59bp,因?yàn)橐话阋锖铣梢?9bp為分水嶺,超過59bp價(jià)格和時(shí)間成本都會(huì)高很多。oligos靠3'末端互補(bǔ)序列相互退火,形成帶有g(shù)aps的雙鏈產(chǎn)物,再由DNA聚合酶補(bǔ)齊gaps,形成帶有切刻的DNA雙鏈,這種產(chǎn)物經(jīng)過Taq DNA Ligase鏈接形成完整的雙鏈產(chǎn)物,依此為模板進(jìn)行PCR擴(kuò)增即可得到目標(biāo)基因,也可以直接使用帶有切刻的DNA雙鏈作為模板進(jìn)行PCR擴(kuò)增。

2 基于逐漸延伸的step by step法

這種方法僅最后一條引物為反向,其余均為正向,正向引物間具有重疊序列。倒數(shù)第一條oligo與倒數(shù)第二條oligo靠末端互補(bǔ)序列相互退火,經(jīng)過第一次PCR循環(huán),雙鏈延長,延長的雙鏈與倒數(shù)第三條oligo繼續(xù)退火、延長,......,依此類推,直至全長序列合成。這種方法理論上一次PCR循環(huán)只能延伸一條引物,N條oliogs就至少需要經(jīng)過N個(gè)PCR循環(huán),由于只有一個(gè)延伸端,引物設(shè)計(jì)比方法1簡單,而且引物數(shù)目不需要必須為偶數(shù)。

全基因合成一般步驟

⒈ 設(shè)計(jì)PCR引物

可以借助自動(dòng)設(shè)計(jì)工具也可以人工設(shè)計(jì),借助工具后面會(huì)詳細(xì)介紹。如果人工設(shè)計(jì),推薦使用SnapGene(這款軟件的強(qiáng)大就不多說了,搞分子生物學(xué)應(yīng)該都知道,網(wǎng)上有很多破解版,沒安裝的話自己去百度一個(gè)吧),將全基因序列復(fù)制進(jìn)去之后,先調(diào)出“Preferences”面板,找到“Primer”選項(xiàng),把3’端最短匹配長度和最低Tm分別設(shè)置為10bp和40℃,這樣當(dāng)你添加引物時(shí)軟件就會(huì)自動(dòng)提醒有沒有次級(jí)結(jié)合位點(diǎn)(如下圖)。

因?yàn)?’端錯(cuò)配對(duì)本文中的全基因合成方法十分不利,如果這兩個(gè)設(shè)置太低實(shí)在難以設(shè)計(jì)出引物,可以適當(dāng)調(diào)高至12bp和45℃,還不行的話只能優(yōu)化密碼子后再重新設(shè)計(jì)。

引物的長度預(yù)設(shè)為59bp,重點(diǎn)是重疊區(qū)的設(shè)計(jì),一般應(yīng)該根據(jù)重疊區(qū)的Tm來確定,不同重疊區(qū)之間的Tm平衡很重要,一般?Tm不超過3℃,推薦把Tm設(shè)置在55-58℃之間。需要注意的是,針對(duì)本文的方法一,引物數(shù)目必須是偶數(shù),從序列開頭往后一條一條的拉,下一條oligo的起點(diǎn)是上一條的終點(diǎn)-重疊區(qū),上正下反,如果最后為奇數(shù)條,要調(diào)整最后幾條長度,補(bǔ)出一條反向引物。

針對(duì)方法二,從序列開頭拉一條正向,剩余全部為反向直到末尾,也可以從末尾拉一條反向,剩余為正向直到開頭,這種方法不用管引物數(shù)目。

⒉ PCR獲得全長產(chǎn)物

一般需要兩輪PCR。第一輪,加入少量引物,推薦50uL體系中0.5-1pmol/個(gè)oligo,10-15個(gè)循環(huán),獲得全長模板,本輪PCR推薦使用的DNA聚合酶應(yīng)該同時(shí)缺失3’-5’和5’-3’外切酶活性,這兩種活性會(huì)損傷重疊區(qū)的Tm平衡;第二輪,取1uLPCR產(chǎn)物做模板,加入20pmol全長上下游引物,20-25個(gè)循環(huán)獲得目標(biāo)基因,本輪PCR應(yīng)使用高保真DNA聚合酶。

⒊ 克隆至表達(dá)載體

通過同源重組,酶切鏈接等方法將目標(biāo)基因插入載體中,轉(zhuǎn)化大腸桿菌或其他宿主感受態(tài)細(xì)胞,獲取單克隆子。提示:在全基因合成前,一定要針對(duì)克隆/表達(dá)載體設(shè)計(jì)好同源臂或者酶切位點(diǎn),直接加在全基因序列上,否則還要單獨(dú)設(shè)計(jì)引物添加同源臂或者酶切位點(diǎn)。

⒋ 測(cè)序鑒定

菌體PCR鑒定陽性克隆子并挑選陽性克隆子測(cè)序,正確的克隆可用于下游的表達(dá)和純化。

在線設(shè)計(jì)工具

OPTIMIZERhttp://genomes.urv.es/OPTIMIZER/,這是一個(gè)非常優(yōu)秀的在線設(shè)計(jì)工具,集密碼子優(yōu)化和全基因合成于一身,不過他生成的oligo只能是50、55、60等5的整倍(60就很尷尬了),而且它不檢查引物條數(shù),最后一條可能形成錯(cuò)配,這可以通過再設(shè)計(jì)額外的全長引物彌補(bǔ)。不過我現(xiàn)在發(fā)現(xiàn)打不開了,不知道是我的網(wǎng)絡(luò)問題還是網(wǎng)址/服務(wù)器出了問題。

DNA Works[8]:這個(gè)工具來源于《Nucleic Acids Research》,論文中的連接失效了,這是我新找到的連接:https://hpcwebapps.cit.nih.gov/dnaworks/,也支持密碼子優(yōu)化,不過我覺得不是太好用,參數(shù)太多有點(diǎn)復(fù)雜了。

Gene2oligo[9]:也來源于《Nucleic Acids Research》,它設(shè)計(jì)的引物之間是沒有空隙(gaps)的,論文中的連接也失效了(原來的鏈接:http://berry.engin.umich.edu/gene2oligo),我也沒找到新的。

Assembly PCR Oligo Maker[10]:來源于《Nucleic Acids Research》,論文中的鏈接為: http://publish.yorku.ca/~pjohnson/AssemblyPCRoligomaker.html,我還是打不開(我都快哭了)。

GeMS[11]:來源于《Nucleic Acids Research》,這是一個(gè)軟件套件,功能很多,鏈接是:http://software.kosan.com/GeMS,打不開。

GeneDesign[12]:來源于《Genome Research》,論文中的鏈接是:http://slam.bs.jhmi.edu/gd,但依然打不開,從論文內(nèi)容看與我的工具比較像,也根據(jù)Tm計(jì)算重疊區(qū),可惜沒辦法看到源碼。

gene2oligoshttp://www.liuzhen106.com/tools/104.html,這個(gè)一定打得開,這是我自己寫的工具,包括密碼子分析與優(yōu)化,將基因自動(dòng)轉(zhuǎn)化為oligos,生成參考實(shí)驗(yàn)方案三個(gè)功能。生成的oligos,具有統(tǒng)一長度,重疊區(qū)具有相同的Tm值,Tm計(jì)算公式為:Tm = 64 + 0.41×GC - 528/n,怎么來的參考我的《PCR引物設(shè)計(jì)大法》。生成的oligos可以,一鍵復(fù)制,格式為oligo+序列編號(hào)+空格+Tab+序列(5’-3’),可以直接導(dǎo)入SnapGene。

引物設(shè)計(jì)原則

  • 長度:40-59bp,原則上引物長度即不能太短也不能太長。太短可能重疊區(qū)不夠,無法達(dá)到Tm均衡,而且oligos之間空隙很短或者沒有空隙,這樣相當(dāng)于對(duì)目標(biāo)基因全覆蓋,比較耗費(fèi)堿基。引物越長,gaps越大,更節(jié)省堿基,但引物越長,引物合成越困難,我在《引物合成原理及純化方式選擇》一文中介紹過,引物越長副產(chǎn)物越多,如果沒有高規(guī)格的純化方式,可能會(huì)導(dǎo)致增高的非特性拼接概率。有些文獻(xiàn)喜歡用40-46nt的引物,本文優(yōu)先考慮長堿基,畢竟節(jié)儉堿基嘛。利用本文的方法,一般需要合成的總堿基數(shù)是全長序列的1.5倍,按照普通引物合成的價(jià)格,能夠比合成公司節(jié)約將近40%的成本

  • 重疊區(qū):在oligos相互退火時(shí),引物間的結(jié)合是同時(shí)發(fā)生的,因此重疊區(qū)的Tm均衡就十分重要,如果某些oligo的Tm過低,退火時(shí)不易與其它oligos結(jié)合可能導(dǎo)致缺失,如果Tm過高,可能形成穩(wěn)定的中間片段,不利于獲得全長模板。

  • 3’端錯(cuò)配:針對(duì)本文所述的兩種方法,3’端的錯(cuò)配可能會(huì)導(dǎo)致錯(cuò)誤的產(chǎn)物,比如有1-6條oligo,原本應(yīng)該按順序連接起來,如果引物1和4末端存在互補(bǔ)序列,那么就可能形成縮短產(chǎn)物,而且這種產(chǎn)物在第二輪PCR中往往被優(yōu)先擴(kuò)增,這會(huì)影響下游實(shí)驗(yàn)。當(dāng)然有時(shí)某些引物的3’端可能存在多個(gè)結(jié)合位點(diǎn),尤其是高GC的序列,可能不得不存在幾個(gè)錯(cuò)配堿基。那么這個(gè)3’端錯(cuò)配長度是多少才能使用呢?當(dāng)然這個(gè)沒有絕對(duì)界限,比如按Tm計(jì)算比完整重疊區(qū)的Tm低20℃,實(shí)際上這也是降低了錯(cuò)配的概率,我在以前的文章中解釋過Tm的意義,Tm為40℃的序列不是說在50℃就完全不退火了,實(shí)際上仍然有一部分退火,只不過比例很低。如果使用長度來界定,8-10bp是一個(gè)常用的標(biāo)準(zhǔn)。此外,引物3’端對(duì)PCR延伸效率也很重要,有研究認(rèn)為最后一個(gè)堿基最好為G/C,因此這一點(diǎn)也需要考慮。

  • 引物條數(shù):一般,我們想要盡可能少的使用引物,那么只能使用盡可能長的引物。至于引物數(shù)目是不是必須為偶數(shù),這跟方法有關(guān)系,依靠一正一反相互延伸的,理論上需要偶數(shù)條,如果最后一條為奇數(shù)條,一般需要調(diào)整前面的引物長度,再補(bǔ)出一條反向引物。

驗(yàn)證設(shè)計(jì)效果

我的程序輸出的引物可以被SnapGene識(shí)別,菜單欄點(diǎn)擊“Primer”工具,點(diǎn)擊”Import Primer from a List“選項(xiàng),選擇從剪貼板導(dǎo)入序列,

可以查看個(gè)引物是否完全覆蓋目標(biāo)序列,引物的“頭尾“是否沖突等等。

以GFP為目標(biāo)序列測(cè)試一下:

①從NCBI上找到GFP的序列,粘貼到文本框中,首先分析密碼子偏性;

大腸桿菌的稀有密碼子用紅色標(biāo)出,可見GFP原生基因中含有很多稀有密碼子,可以先執(zhí)行密碼子優(yōu)化。

②生成oligos,有兩種方式,默認(rèn)為方法一,如果引物見相似性高,會(huì)提示使用方法二。

點(diǎn)擊生成oligos按鈕后,會(huì)彈出總堿基數(shù)的統(tǒng)計(jì)信息,然后輸出oliogs序號(hào)及序列,同時(shí)生成實(shí)驗(yàn)方案按鈕和復(fù)制按鈕,一鍵復(fù)制后可導(dǎo)入SanpGene分析。

③SanpGene分析

完全覆蓋了GFP的基因,并且為偶數(shù)條引物,引物間的Tm基本一致(由于程序與SnapGene的Tm算法不一致,在SnapGene上只能看到基本一致。

④生成實(shí)驗(yàn)方案

體外全基因合成一般一次不超過1000bp,一次性合成太長會(huì)增加出錯(cuò)的概率,我推薦按800bp分段,程序會(huì)根據(jù)你輸入的序列長度推薦分段數(shù)。

希望這個(gè)工具能幫到你完成全基因合成,我還寫了輔助載體構(gòu)建的工具,以后有機(jī)會(huì)再介紹。

參考文獻(xiàn)


[1] Prodromou,C. and Pearl,L. (1992) Recursive PCR: a novel technique for total gene synthesis. Protein Eng., 5, 827–829.
[2] Sandhu,G.S, Aleff,R.A. and Kline,B.C. (1992) Dual asymmetric PCR: one-step construction of synthetic genes. Biotechniques, 12, 14–16.
[3] Stemmer,W.P., Crameri,A., Ha,K.D., Brennan,T.M. and Heyneker,H.L. (1995) Single-step assembly of a gene and entire plasmid from large numbers of oligodeoxyribonucleotides. Gene, 164, 49–53.
[4] Au,L.C., Yang,F.Y., Yang,W.J., Lo,S.H. and Kao,C.F. (1998) Gene synthesis by a LCR-based approach: high-level production of leptin-L54 using synthetic gene in Escherichia coli. Biochem. Biophys. Res. Commun., 248, 200–203.
[5] Gao,X., Yo,P., Keith,A., Ragan,T.J. and Harris,T.K. (2003) Thermodynamically balanced inside-out (TBIO) PCR-based gene synthesis: a novel method of primer design for high-fidelity assembly of longer gene sequences. Nucleic Acids Res.,31, e143.
[6] Xiong,A.-S., Yao,Q.-H., Peng,R.-H., Li,X., Fan,H.-Q., Cheng,Z.-M. and Li,Y. (2004) A simple, rapid, high-fidelity and cost-effective PCR-based two-step DNA synthesis method for long gene sequences. Nucleic Acids Res., 32, e98.
[7] Young,L. and Dong,Q. (2004) Two-step total gene synthesis method. Nucleic Acids Res., 32, e59.
[8] Hoover,D.M. and Lubkowski,J. (2002) DNAWorks: an automated method for designing oligonucleotides for PCR-based gene synthesis. Nucleic Acids Res., 30, e43.
[9] Rouillard,J.-M., Lee,W., Truan,G., Gao,X., Zhou,X. and Gulari,E.(2004) Gene2oligo: oligonucleotide design for in vitro gene synthesis. Nucleic Acids Res., 32, W176–W180.
[10] Rydzanicz,R., Zhao,X.S. and Johnson,P.E. (2005) Assembly PCR oligo maker: a tool for designing oligodeoxynucleotides for constructing long DNA molecules for RNA production. Nucleic Acids Res., 33, W521–W525.
[11] Jayaraj,S., Reid,R. and Santi,D.V. (2005) GeMS: an advanced software package for designing synthetic genes. Nucleic Acids Res., 33, 3011–3016.
[12] Richardson,S.M., Wheelan,S.J., Yarrington,R.M. and Boeke,J.D. (2006) GeneDesign: rapid, automated design of multikilobase synthetic genes. Genome Res., 16, 550–556.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容