做生物基礎(chǔ)科研研究的同學(xué)肯定都聽過CRISPR-Cas9 系統(tǒng)的大名,你對(duì)這獨(dú)領(lǐng)風(fēng)騷的系統(tǒng)了解多少呢? 快來隨我一起學(xué)習(xí)一下吧
小郭叨叨叨:
最近將要開始使用CRISPR-Cas9系統(tǒng)結(jié)合lentivirus系統(tǒng)進(jìn)行實(shí)驗(yàn),訂購(gòu)質(zhì)粒時(shí)發(fā)現(xiàn)對(duì)CRISPR-Cas9系統(tǒng)某些概念及細(xì)節(jié)不甚清楚,搜尋度娘,發(fā)現(xiàn)度娘也愁眉苦臉,遂決定較為系統(tǒng)地學(xué)習(xí)一下此方面的知識(shí)。特此翻譯整理相關(guān)內(nèi)容。
本部分內(nèi)容主要翻譯于abm公司網(wǎng)站,感興趣的同學(xué)請(qǐng)移步觀看原文An Intro to CRISPR Cas9
CRISPR Cas9 -- Clustered Regularly Interspaced Short Palindromic Repeats CRISPR-Associated Proteins 9
細(xì)菌免疫系統(tǒng)
Crispr-CAS9系統(tǒng)最初在細(xì)菌和古生菌中觀察到,作為一種適應(yīng)性微生物免疫系統(tǒng),提供對(duì)外來病毒和質(zhì)粒的獲得性免疫;已測(cè)序物種中,40%的細(xì)菌和90%的古生菌可觀察到CRISPR基因座,且細(xì)菌中可能存在一個(gè)以上的基因座。
入侵的外來DNA被Cas核酸酶切割,然后以間隔序列的形式被保守的重復(fù)序列捕獲并整合到crispr位點(diǎn),所獲得的間隔物作為創(chuàng)建短CRISPR RNA(crRNAs;create short CRISPR RNAs )的模板,它與反式激活cRNA(tracRNA;trans-activating crRNA )形成復(fù)合物;它們一起起到引導(dǎo)鏈的作用,將cas9核酸酶導(dǎo)向互補(bǔ)的入侵DNA(3)。一旦結(jié)合,cas9蛋白通過其HNH和RuvC-like核酸酶結(jié)構(gòu)域分別切割“crRNA互補(bǔ)”及反義鏈。

文獻(xiàn)中已描述45個(gè)不同的cas蛋白家族,每一個(gè)家族在合成cRNA、整合新的間隔序列和切割入侵DNA中具有不同的作用。CRISPR-Cas系統(tǒng)通常分為三類,這取決于Cas蛋白質(zhì)序列和結(jié)構(gòu):I型、II型和III型。目前常用于基因組編輯的CRISPR-Cas9系統(tǒng)是一個(gè)Ⅱ型CRISPR-Cas系統(tǒng),它是從化膿性鏈球菌(Streptococcus pyogenes)改編而來的。
CRISPR系統(tǒng)的組成及機(jī)理
內(nèi)切酶 + 短引導(dǎo)RNA
內(nèi)切酶是化膿性鏈球菌產(chǎn)生的細(xì)菌CAS9核酸酶蛋白。CAS9核酸酶具有兩個(gè)DNA剪切結(jié)構(gòu)域(Ruvc1和HNH-like核酸酶域),可剪切雙鏈DNA使雙鏈斷裂(DSB;double strand breaks)。
gRNA是一種工程化的單鏈嵌合體RNA,結(jié)合了細(xì)菌tracrRNA的支架功能和細(xì)菌crRNA的特異性。gRNA 5'端的最后20bp作為一個(gè)歸位裝置,通過RNA-DNA堿基配對(duì),將CAS9/GRNA復(fù)合物招募到PAM(protospacer adjacent motif )上游特定的DNA靶位。不同菌株和不同類型的CRISPR-Cas蛋白之間的PAM序列不同,化膿性鏈球菌Cas9的序列是5’-NGG。目前的CRISPR-CAS9系統(tǒng)可以直接用于任何5’-N20-NGG DNA序列,并產(chǎn)生精確的雙鏈斷裂。然后,通過在幾乎所有細(xì)胞類型和生物體中發(fā)現(xiàn)的兩種通用修復(fù)機(jī)制修復(fù)DSB:非同源末端連接(NHEJ;the non-homologous end-joining )或同源定向修復(fù)(HDR;the homology-directed repair)。

非同源末端連接修復(fù)(NHEJ)
NHEJ修復(fù)路徑是一種容易出錯(cuò)的修復(fù)機(jī)制,用于在沒有合適的修復(fù)模板的情況下修復(fù)雙鏈斷裂。NHEJ通路試圖將DSB的切割端連接在一起。然而,這一過程往往導(dǎo)致DSB位點(diǎn)的插入或刪除(indels)突變,導(dǎo)致移位或引入永久性破壞目標(biāo)基因開放閱讀框的成熟前終止密碼子。盡管NHEJ的INDEL結(jié)果很大程度上是隨機(jī)的,但是科學(xué)家們可以通過將gRNA定位于相關(guān)基因的N末端來確保最大程度的基因破壞;這將確??蚣芤莆煌蛔儾粫?huì)導(dǎo)致部分功能性基因產(chǎn)物。在利用NHEJ修復(fù)通路時(shí),設(shè)計(jì)第一或第二外顯子中的gRNA并避免靶基因的內(nèi)含子區(qū)是一個(gè)很好的實(shí)踐。

CAS9核酸酶同源定向修復(fù)(HDR)
除NHEJ,細(xì)胞還能夠利用一種更精確的修復(fù)機(jī)制,即同源定向修復(fù)(HDR)途徑。這種修復(fù)機(jī)制可以用來引入特定的核苷酸修飾基因組DNA。在這種方法中,將與預(yù)期編輯位點(diǎn)上游和下游序列高度同源的DNA修復(fù)模板連同適當(dāng)?shù)膅RNA和CAS9核酸酶一起引入細(xì)胞。在這種合適的模板存在下,不易出錯(cuò)的HDR機(jī)制可以通過重組忠實(shí)地對(duì)CAS9誘導(dǎo)的DSB站點(diǎn)進(jìn)行所需的更改。在設(shè)計(jì)修復(fù)模板時(shí),請(qǐng)確保目標(biāo)序列沒有緊跟PAM序列,或者PAM序列被排除或變異。這是為了避免使用相同的CRISPR-CAS9系統(tǒng)對(duì)修復(fù)模板進(jìn)行降解。

PAM識(shí)別序列
CRISPR-CAS9系統(tǒng)可以通過gRNA的設(shè)計(jì)針對(duì)任何基因組區(qū)域的特異性取決于位于目標(biāo)序列下游的PAM序列。作為細(xì)菌和古細(xì)菌免疫系統(tǒng),PAM識(shí)別序列激活CAS9的核酸酶域,從而作為區(qū)分自我和非自我的手段(如:阻止CRISPR基因座被靶向)。

PAM識(shí)別序列因來源于CAS9核酸酶的細(xì)菌種類和類型而異。最常用的II型CRISPR系統(tǒng)使用來自化膿性鏈球菌的CAS9核酸酶。這種特殊的核酸酶在GRNA序列的3'端識(shí)別5'-NGG。其他市售CAS9可識(shí)別其他PAM序列。
Table 1: PAM Sequences from Different Species and Subtypes of Cas Nucleases.
| Species | Subtype | PAM Sequence |
|---|---|---|
| S. pyogenes | II | 5'-NGG |
| S. solfataricus | I-A1 | 5'-CCN |
| S. solfataricus | I-A2 | 5'-TCN |
| H. walsbyi | I-B | 5'-TTC |
| E. coli | I-E | 5'-AWG |
| E. coli | I-F | 5'-CC |
| P. aeruginosa | I-F | 5'-CC |
| S. Thermophilus | II-A | 5'-NNAGAA |
| S. agelactiae | II-A | 5'-NGG |
Cas9 Nickase 和 Cas9 Double Mutant
Cas9 Nickase
Cas9 Nickase是Cas9的一種突變形式,其RuvC1 或HNH-like核酸酶域中分別有D10A 或H840A 突變,這種突變形式導(dǎo)致在目標(biāo)位點(diǎn)產(chǎn)生單鏈刻痕而不是雙鏈斷裂。由于單鏈斷裂(或缺口)通常使用完整的互補(bǔ)DNA鏈作為修復(fù)模板通過HDR 途徑快速修復(fù),因此Cas9 Nickase可將脫靶效應(yīng)最小化。

為了利用Cas9 Nickase進(jìn)行基因組編輯,需要兩個(gè)gRNA。這兩個(gè)gRNA需設(shè)計(jì)在相反的DNA鏈上,但其距離很近,以確保一旦兩個(gè)鏈被Cas9 Nickase切割,DSB就會(huì)被誘導(dǎo)。這對(duì)Cas9 Nickase修改減少了脫靶效應(yīng),因?yàn)樾鑳蓚€(gè)gRNA共同產(chǎn)生一個(gè)DSB。一旦形成DSB,NHEJ或HDR路徑將被激活以完成基因組編輯過程。

如果共同引入含有所需修飾的修復(fù)模板DNA與gRNA和Cas9 nickase,則Cas9 Nickase也可用于通過同源重組產(chǎn)生核苷酸修飾。
Table 2: Cas9 Nickase and Nuclease Usage in Gene Disruption and Specific Gene Modification
| gRNA Requirement | Gene Disruption (NHEJ) | Specific Gene Modification (HDR) | |
|---|---|---|---|
| Cas9 Nuclease | 1 gRNA per Target | ***** | **** |
| Cas9 Nickase | 1 gRNA per Target | * | ** |
| Cas9 Nickase | 2 gRNA per Target | ***** | **** |
Cas9 Double Mutant
Cas9雙突變體或Null突變體是通過突變野生型Cas9的兩個(gè)切割結(jié)構(gòu)域而產(chǎn)生的。 這種Cas9蛋白保留了通過gRNA:基因組DNA堿基配對(duì)與基因組DNA結(jié)合的能力。 與Cas9核酸酶和Cas9 Nickase可以實(shí)現(xiàn)永久性基因破壞不同,Cas9 Null突變體不引入任何基因組修飾。 通過將Cas9雙突變體與其他效應(yīng)蛋白融合,CRISPR Cas9系統(tǒng)可以將其作用擴(kuò)展到基因調(diào)控,基因組成像,染色質(zhì)或DNA修飾以及染色質(zhì)免疫沉淀。

spCas9, saCas9, and Cpf1 核酸酶
Table 3: Comparison of spCas9, saCas9, and Cpf1 nucleases
| spCas9 | saCas9 | Cpf1 | |
|---|---|---|---|
| Gene Length | ~4.1 kb | ~3.3 kb | ~3.8 kb |
| Cleavage Type | Blunt ends | Blunt ends | 5' overhangs |
| Repeated Cleavage | No | No | Yes |
| Cleavage Site | Within recognition sequence | Within recognition sequence | Downstream of recognition sequence |
| PAM Sequence | 5’-NGG-3’ | 5’-NNGRRT-3’ | 5’-TTN-3’ or 5’-TTTN-3’ |
| RNA Required | tracrRNA + crRNA | tracrRNA + crRNA | crRNA |
spCas9
large size and G-rich PAM sequence
Cpf1 Nuclease
Cpf1于2015年底由麻省理工學(xué)院的Feng Zhang小組發(fā)現(xiàn)。在16種候選Cpf1蛋白中,兩種在哺乳動(dòng)物細(xì)胞中最具潛力的高特異性基因組編輯工具:asCpf1和lb2Cpf1。這些核酸酶在人類細(xì)胞中具有與常用spCas9相當(dāng)?shù)陌邢蚯懈钚省?/p>
Cpf1允許新的定位可能性,因?yàn)樗R(shí)別富含T的PAM位點(diǎn)。與Cas9的富含G的PAM要求相比,這顯著擴(kuò)大了可能的基因組目標(biāo)的范圍。雖然Cas9可能是靶向富含G的區(qū)域的優(yōu)選核酸酶,但Cpf1可用于靶向富含T的區(qū)域。在哺乳動(dòng)物細(xì)胞中,Cpf1可以靶向如支架/基質(zhì)附著區(qū)域和著絲粒DNA的難以延伸的DNA片段。使用Cpf1還可以探索由富含AT的結(jié)構(gòu)域控制的細(xì)菌基因組,例如引起瘧疾的惡性瘧原蟲(Plasmodium falciparum)。同樣,在Cas9的表達(dá)有毒的情況下,Cpf1可能是Cas9的有用替代品,如在谷氨酸棒桿菌(Corynebacterium glutamicum)和幾種藍(lán)細(xì)菌(Cyanobacteria)中所見。
Cpf1需要較短的guide RNA才能運(yùn)作。雖然Cas9需要tracrRNA的存在來處理crRNA,但Cpf1可以自己處理pre-crRNA。這對(duì)于生物技術(shù)特別感興趣,因?yàn)榕c用于Cas9的~100nt tracrRNA / crRNA雜交體相比,Cpf1可以僅用~42nt crRNA靶向。這將工程化sgRNA的大小減少了一半以上,同時(shí)還簡(jiǎn)化了與合成和化學(xué)修飾相關(guān)的方法和成本。這種自編輯功能也使Cpf1成為多重基因組編輯的最佳選擇,因?yàn)楦嗟膕gRNA可能適合一個(gè)載體。
另一個(gè)顯著差異是Cas9在切割后產(chǎn)生平端,而Cpf1留下可用于定向克隆的粘性5'突出端。產(chǎn)生粘性末端的其他方法,例如限制酶消化,具有比Cpf1更短的識(shí)別序列,因此切割性較低。已經(jīng)利用Cpf1的這種特性在體外進(jìn)行高度特異性的DNA組裝。在體內(nèi)使用這種方法,科學(xué)家們可以對(duì)非分裂細(xì)胞(如神經(jīng)元)進(jìn)行DNA敲入,通過HDR進(jìn)行基因組編輯尤其具有挑戰(zhàn)性。
Cpf1切割PAM位點(diǎn)下游18-23bp的DNA,導(dǎo)致NHEJ修復(fù)雙鏈DNA斷裂后對(duì)識(shí)別序列沒有破壞。導(dǎo)致Cpf1能夠進(jìn)行多輪DNA切割,并且增加了進(jìn)行所需基因組編輯的機(jī)會(huì)。相比之下,由于Cas9僅在PAM位點(diǎn)上游切割3bp,因此NHEJ途徑導(dǎo)致indel突變,其破壞識(shí)別序列,從而防止進(jìn)一步的切割輪次。理論上,重復(fù)的DNA切割輪次應(yīng)該導(dǎo)致Cpf1導(dǎo)致靶基因的沉默增加,并且在敲入實(shí)驗(yàn)的情況下,發(fā)生同源定向修復(fù)的機(jī)會(huì)更大。
Zhang等人的一項(xiàng)研究。表明Cpf1介導(dǎo)的基因組編輯可用于糾正誘導(dǎo)多能干細(xì)胞和小鼠的肌營(yíng)養(yǎng)不良基因突變。這導(dǎo)致基因表達(dá)恢復(fù),小鼠癥狀得到糾正。 Cpf1也已成功用于蛋白質(zhì)-sgRNA復(fù)合物中,以突變大豆和煙草植物中的基因。
saCas9 Nuclease
雖然化膿性鏈球菌Cas9(S. pyogenes Cas9; spCas9)是最常用的CRISPR核酸酶,但最近的注意力已轉(zhuǎn)向從金黃色葡萄球菌中分離的微型Cas9核酸酶(S. aureus; saCas9)。這種小核酸酶通過使生物體內(nèi)基于CRISPR的基因編輯更加可行,具有改變生物醫(yī)學(xué)研究產(chǎn)業(yè)的巨大潛力。 SaCas9和spCas9能夠以相當(dāng)?shù)男试隗w內(nèi)切割真核DNA。但saCas9具有幾個(gè)特性,使其對(duì)某些應(yīng)用更有用。
SaCas9比spCas9小約1kb,使其能夠更有效地包裝到較小容量的腺相關(guān)病毒(AAV)中,為調(diào)控元件,crRNAs和tracrRNAs留下額外空間。通過將Cas9和sgRNA包含在一個(gè)構(gòu)建體(稱為All-In-One載體)中,可以在一個(gè)轉(zhuǎn)染/轉(zhuǎn)導(dǎo)步驟中完成Cas9表達(dá)和sgRNA靶向。由于其低免疫原性和選擇性感染某些組織類型的能力,AAV是用于體內(nèi)研究的優(yōu)選基因遞送方法。
同樣,與spCas9相比,saCas9為基因組編輯開辟了新的可能性,因?yàn)樗哂胁煌亩ㄎ荒芰Α?spCas9識(shí)別5'-NGG-3'的PAM序列,而saCas9識(shí)別5'-NNGRRT-3'??捎糜赑AM序列的更多種類意味著可用于基因組編輯的增加的基因座數(shù)量。當(dāng)需要使用同源定向修復(fù)精確編輯基因時(shí),這是特別有益的,因?yàn)楫?dāng)識(shí)別序列非常接近待編輯區(qū)域時(shí)HDR最有效。
saCas9較長(zhǎng)的PAM的一個(gè)缺點(diǎn)是,該序列在基因組中的發(fā)生頻率低于spCas9的PAM序列,限制了其潛在的效用。 然而,saCas9較長(zhǎng)的PAM序列應(yīng)該有助于防止脫靶的切割,因?yàn)樗哂懈叩奶禺愋浴?/p>
麻省理工學(xué)院張實(shí)驗(yàn)室于2015年進(jìn)行的一項(xiàng)研究調(diào)查了體內(nèi)saCas9的表現(xiàn)。 他們將攜帶saCas9的AAV注射到小鼠體內(nèi)以破壞PCSK9基因,該基因與家族性高膽固醇血癥有關(guān)。 這導(dǎo)致1周后肝組織中基因修飾> 40%,注射后4周沒有毒性跡象。 最近的其他工作已經(jīng)用于開發(fā)具有使用分子進(jìn)化的松弛PAM識(shí)別特異性的變體saCas9。 與野生型saCas9相比,這種變體允許更大范圍的潛在編輯目標(biāo),同時(shí)保留其小尺寸傳達(dá)的優(yōu)勢(shì)。
為什么有些研究人員更喜歡saCas9和spCas9?
- saCas9更緊湊,但具有與spCas9相同的基因編輯能力。
- saCas9靶向不同的基因組位點(diǎn)而不是spCas9:saCas9具有與spCas9不同的PAM序列,使其成為spCas9的補(bǔ)充工具。
- saCas9具有降低的脫靶切割風(fēng)險(xiǎn):由于它的PAM序列在基因組中更長(zhǎng)且更罕見,因此saCas9與靶DNA的非特異性相互作用的風(fēng)險(xiǎn)較低。
saCas9在體外比spCas9更有效:與spCas9相比,saCas9需要更少的酶,更少的時(shí)間來完成DNA切割。
CRISPR-saCas9-vs-spCas9-infographic-fullsize-1.jpg
基于蛋白質(zhì)的基因組編輯工具的比較
兩種常見的基于蛋白質(zhì)的基因組編輯工具
鋅指核酸酶(Zinc-finger Nucleases; ZFNs)
轉(zhuǎn)錄激活因子樣效應(yīng)核酸酶(Transcription Activator-Like Effector Nucleases; TALENs)
Table 4: Comparison of current genome editing technologies
| ZFNs | TALENs | CRISPR Cas9 | |
|---|---|---|---|
| DNA Binding Domain | Cys2-His2 DNA Binding Protein | Conserved Amino Acid Repeated Motif | Single Stranded gRNA |
| DNA Cleavage Domain | FokI Restriction Endonuclease | FokI Restriction Endonuclease | Cas9 Endonuclease |
| Guiding Mechanism | Protein Guided | Protein Guided | RNA Guided |
| Ease of Design | * | *** | ***** |
| Minimized off-target Effects | ***** | ***** | *** |
| Multiplexibility | ** | ** | ***** |
