2021-10-25

Science | 張峰:利用RNA來定位DNA位置的蛋白的數(shù)量和種類可能遠超想象

原創(chuàng)?驕陽似我?圖靈基因?今天

收錄于話題#前沿分子生物學技術(shù)

撰文:驕陽似我

IF47.728

推薦度:?????

亮點:

1.?本文從IS200/IS605轉(zhuǎn)座子重建了CRISPR-Cas9系統(tǒng)的進化,發(fā)現(xiàn)IscB使用單個非編碼RNA進行RNA引導的雙鏈DNA切割并且可以用于人類細胞中的基因組編輯。還證明了TnpBRNA引導的核酸酶活性,另一種IS200/IS605轉(zhuǎn)座子編碼的蛋白質(zhì)和Cas12內(nèi)切核酸酶的可能祖先。

2.?這項工作揭示了一類廣泛的轉(zhuǎn)座子編碼的RNA引導的核酸酶,本文將其命名為OMEGA(專性移動元件引導活性),具有作為生物技術(shù)發(fā)展的巨大潛力。


IscB蛋白是在IS200/IS605轉(zhuǎn)座子的不同家族中編碼的推定核酸酶,可能是RNA引導的核酸內(nèi)切酶Cas9的祖先,但IscB的功能及其與任何RNA的相互作用仍未表征。原核RNA引導的防御系統(tǒng)CRISPR-Cas9(II型CRISPR-Cas)已被用于真核細胞中的基因組編輯,被認為是從IscB蛋白進化而來的。盡管其在原核生物中廣泛分布并且與Cas9共享域組成和體系結(jié)構(gòu),但IscB的功能仍然未知。此外,鑒于尚未報道IscB與非編碼RNA(ncRNA)或CRISPR陣列相關(guān),Cas9系統(tǒng)中RNA引導活性的進化起源尚不清楚。

近期,在Science雜志上發(fā)表了一篇名為“The widespread IS200/IS605 transposon family encodes diverse programmable RNA-guided endonucleases”的文章,使用系統(tǒng)發(fā)育分析,RNA測序(RNA-seq)和生化實驗,試圖闡明這些蛋白質(zhì)的功能以及2類CRISPR系統(tǒng)中RNA引導活性的起源。


IscB長約400個氨基酸,含有通過插入橋螺旋(BH)和HNH內(nèi)切核酸酶結(jié)構(gòu)域分裂的RuvC內(nèi)切核酸酶結(jié)構(gòu)域,該結(jié)構(gòu)與Cas9共享。對含有HNH或分裂RuvC核酸內(nèi)切酶結(jié)構(gòu)域的蛋白質(zhì)進行了全面搜索,發(fā)現(xiàn)Cas9和IscB是唯一含有兩個結(jié)構(gòu)域的蛋白質(zhì)。還顯示IscB含有先前未鑒定的N末端,其與已知結(jié)構(gòu)域缺乏明顯的同源性,并且在Cas9中不存在,在其保守序列基序后表示PLMP。RuvC,BH和HNH結(jié)合域的聚類和系統(tǒng)發(fā)育分析強烈表明,所有現(xiàn)存的Cas9都來自單個祖先IscB。從每個簇中搜索與IscB基因相鄰的CRISPR陣列,發(fā)現(xiàn)了六個不同的IscB組,包含16個簇(共603個),與CRISPR相關(guān),與以前的觀察相反。CRISPR相關(guān)的IscB分散在IscB系統(tǒng)發(fā)育樹周圍,這表明它們獨立進化,一個關(guān)聯(lián)事件導致Cas9譜系??偣茶b定了31個獨特的CRISPR相關(guān)iscB基因座(共2811個)。首先檢查了一組CRISPR相關(guān)的ISCB,類似于非CRISPR相關(guān)的ISCB(氨基酸同一性約為50%)。在大腸桿菌中異源表達來自該進化枝的代表性基因座并進行小RNA-seq,其顯示不僅CRISPR陣列的表達,而且CRISPR陣列和IscB開放閱讀之間的329堿基對(bp)基因間區(qū)域框架(ORF)。本文還純化了IscB蛋白并對共純化的RNA進行了測序,證明該蛋白與包含CRISPR陣列和該基因間區(qū)域的單個ncRNA組分相互作用。鑒于其與包含CRISPR直接重復(DR)和間隔區(qū)的ncRNA的相互作用,以及其與Cas9類似的結(jié)構(gòu)域結(jié)構(gòu),測試了該IscB的RNA引導的核酸內(nèi)切酶活性。使用先前建立的原型間隔區(qū)相鄰基序(PAM)-發(fā)現(xiàn)測定,觀察到特定PAM序列的消耗,表明CRISPR相關(guān)的ISCB是可重編程的RNA引導的核酸酶。發(fā)現(xiàn)IscB至少在功能上與CRISPR相關(guān),并且可能在其他情況下,表明IscB系統(tǒng)更一般地共享核心祖先ncRNA基因,該基因易于進化成CRISPR陣列,并且在某些情況下是單獨的反式激活CRISPR RNA。為了驗證這一假設(shè),比對了563個非冗余iscB基因座,并在iscB ORF的上游或下游搜索保守核苷酸(nt)序列。該分析揭示了ORF上游長度約300bp的高度保守的基因間區(qū)域,其5'末端的保守性下降,這對應(yīng)于IS200/IS605轉(zhuǎn)座子末端。共有CRISPR相關(guān)的IscB ncRNA和協(xié)方差折疊的RNA二級結(jié)構(gòu)的比較揭示了高度的結(jié)構(gòu)和序列相似性,特別是在共享的多干區(qū)域和假結(jié)中。推斷wRNA中5'-最不保守的序列可能起指導序列的作用,因為預測緊鄰下游的序列形成發(fā)夾,其結(jié)構(gòu)類似于CRISPR相關(guān)IscB中DR/抗重復雙鏈體形成的發(fā)夾ncRNA。圖1:IscB與進化上保守的非編碼RNA相關(guān)。

為了檢測IscB是否能夠切割與假定的wRNA指南互補的DNA,使用體外轉(zhuǎn)錄/翻譯(IVTT)表達系統(tǒng)用KraIscB-1進行了體外質(zhì)粒切割試驗。發(fā)現(xiàn)KraIscB-1以wRNA依賴性方式切割靶標,具有ATAAA 3'靶標鄰接基序(TAM)。使用不同的指南(Fn指南)重新定位KRAISCB-1切割同源靶標,暗示IscB是可重編程的RNA引導的核酸酶。接下來在體外對IscB進行了生物化學表征。我們通過鑒定TAM確定了86個(66%)選擇的系統(tǒng)發(fā)育不同系統(tǒng)中的57個的活性。在這57個功能性ISCB中,5個可以在體外用相應(yīng)的wRNA重建以實現(xiàn)有效的靶標切割,并且從中選擇了AwaIscB用于詳細的生物化學表征。證實了重組AwaIscB以可編程方式切割多個雙鏈DNA(dsDNA)靶標的能力,并顯示AwaIscB的活性依賴于鎂,最適溫度為35°至40°C。催化RuvC II殘基(E157A)的突變消除了對非靶DNA鏈的核溶解活性,而HNH結(jié)構(gòu)域催化突變體H212A消除了對靶鏈的核溶解活性。E157A和H212A突變(dAwaIscB)的組合消除了所有dsDNA核酸分解活性。切割產(chǎn)物的測序顯示AwaIscB切割TAM上游3nt的靶鏈,類似于Cas9。非靶鏈的切割發(fā)生在TAM上游8或12 nt,產(chǎn)生長度為5或9 nt的5'突出端。圖2:IscB是可重編程的RNA引導的DNA內(nèi)切核酸酶。


RNA引導系統(tǒng)的顯著優(yōu)點是它們允許效應(yīng)子通過簡單地重編程RNA指導來靶向許多底物。IscB發(fā)展為使用多個指南的一種方法是與CRISPR陣列相關(guān)聯(lián)。鑒于iscB基因座通常編碼單個wRNA,因此不清楚這些系統(tǒng)通常如何或甚至是否實現(xiàn)這種模塊化。通過搜索不直接與iscB ORF相鄰的wRNA,發(fā)現(xiàn)了三種用于指導編碼和切換的額外潛在機制:wRNA陣列,轉(zhuǎn)座子擴增和獨立的反式作用wRNA。wRNA陣列由多個wRNA組成,每個wRNA包含不同的指導,間隔高達200bp,并且在3356個獨特的IscB/IsrB基因座中的15個(0.4%)中發(fā)現(xiàn)。轉(zhuǎn)座子擴增涉及在多個位置插入幾乎相同的IS200/IS605超家族轉(zhuǎn)座子,導致每個基因組有多個基因座,每個基因座能夠用獨特的指導表達幾乎相同的wRNA支架。相比之下,獨立的wRNA更常見,并且在一些基因組中以多拷貝發(fā)現(xiàn),其顯示與iscB沒有可檢測的基因組關(guān)聯(lián)。來自3356個獨特IscB/IsrB基因座中的95個(2.8%)的順式-wRNA幾乎相同(≥95%序列同一性)到遠端編碼的獨立wRNA,這意味著這些獨立的wRNA可以編碼反式編碼的ISCB使用的指導。通過檢查K.racemifer基因組中的10個獨立的wRNA來測試這種可能性,其中9個被發(fā)現(xiàn)表達。在測試的6個獨立的wRNA中,發(fā)現(xiàn)5個可以用來自相同基因組的遠端編碼的IscB介導RNA引導的DNA切割,證明單個IscB可以使用多個反式編碼的wRNA。來自許多wRNA的指導,包括IscB相鄰和反式編碼,主要靶向原核基因組序列,表明IscB系統(tǒng)具有非缺失功能。圖3:IscB使用多種指導編碼機制。


接下來研究了IscB,Cas9和其他同源蛋白之間的進化關(guān)系,以更廣泛地了解RNA引導機制的進化。在尋找包含分裂的RuvC結(jié)構(gòu)域的蛋白質(zhì)時,檢測到另一組較短的?350個氨基酸的IscB同源物,它們也編碼在IS200/IS605超家族轉(zhuǎn)座子中。這些蛋白質(zhì)含有PLMP結(jié)構(gòu)域和分裂的RuvC,但缺乏HNH結(jié)構(gòu)域。將這些蛋白質(zhì)IsrB(插入序列RuvC-like OrfB)重命名為強調(diào)它們獨特的結(jié)構(gòu)域,取代了之前的名稱IscB1。除了IscB和IsrB之外,還鑒定了僅包含PLMP結(jié)構(gòu)域和HNH結(jié)構(gòu)域但不包含RuvC結(jié)構(gòu)域的更小的蛋白質(zhì)家族(約180個氨基酸),將其命名為IshB(插入序列HNH樣OrfB)。為了研究這些蛋白質(zhì)之間的關(guān)系,使用IQTREE 2從分裂的RuvC核酸酶和BH結(jié)構(gòu)域的多重比對構(gòu)建了最大似然(ML)樹。在得到的樹中,IsrB,IscB和Cas9形成了獨特的,強烈支持的進化枝,這表明這些核酸酶中的每一個都起源于獨特的進化事件。然后分析了每個蛋白質(zhì)簇與IS200/IS605 tnpA基因,wRNAs,CRISPR-Cas適應(yīng)基因(cas1,cas2,cas4和csn2),相應(yīng)ORF上游和下游的CRISPR陣列之間的關(guān)聯(lián),以及CRISPR反重復。如上所述,iscB和isrB很少與CRISPR陣列相關(guān),并且未發(fā)現(xiàn)與CRISPR-Cas適應(yīng)基因相關(guān)。ISRB與結(jié)構(gòu)上不同的wRNA相關(guān)。此外確定了兩個不同的Cas9s組。第一種是新亞型II-D,一組相對較小的cas9s(~700個氨基酸),與任何其他已知的cas基因無關(guān)。第二個是從II-C亞型內(nèi)分支的獨特分支,其包括與tnpA相關(guān)的特別大的cas9s(>1700個氨基酸)。tnpA相關(guān)的II-C基因座通常包含異常長的DR(長度超過42bp),并且在一些情況下編碼cas9和其他cas基因之間的HIRAN結(jié)構(gòu)域蛋白。預測的轉(zhuǎn)座子末端圍繞這些基因座中的tnpA,cas獲取基因和CRISPR陣列的各種組合。這些系統(tǒng)發(fā)育和關(guān)聯(lián)分析證實IS200/IS605轉(zhuǎn)座子編碼的ISCB和ISRB與Cas9具有共同的進化歷史。鑒于IsrB進化枝在樹中的深部位置和缺乏HNH結(jié)構(gòu)域,IsrB可能代表祖先狀態(tài),可能是從緊湊的RuvC核酸內(nèi)切酶進化而來的。幾乎所有ISRB都與wRNA相關(guān);這表明這些系統(tǒng)在進化的早期階段成為RNA引導的。IsrB隨后獲得了HNH結(jié)構(gòu)域,可能是通過插入另一個移動元件或與編碼IshB樣蛋白的基因重組,建立了IscB家族。CRISPR陣列出現(xiàn)在IscB系統(tǒng)中多次獨立的場合。這些短陣列由重復序列組成,這些重復序列可以通過復制祖先wRNA的片段而進化。得到的系統(tǒng)包括雜交CRISPR-wRNA,其由部分wRNA之前的CRISPR陣列組成。這些CRISPR相關(guān)的IscB蛋白可能在許多情況下也在RuvC-I和RuvC-II亞結(jié)構(gòu)域之間獲得REC樣插入,通常與CRISPR結(jié)合同時或之后不久。特別是,一個CRISPR相關(guān)的IscB簇(簇2089)可能在標志性PLMP結(jié)構(gòu)域丟失后建立了Cas9家族。此外,亞型II-D的tracrRNA,Cas9子樹中的深分支顯示與IscB wRNA顯著相似,這表明Cas9 tracrRNA最初是從wRNA進化而來的。最后,在與CRISPR適應(yīng)機制(cas1,cas2和可能的cas4)相關(guān)聯(lián)后,Cas9多樣化的爆發(fā)和通過水平基因轉(zhuǎn)移在細菌之間的廣泛分散隨后,導致多種II型CRISPR亞型的進化。我們還探索了wRNA的進化歷史。通過迭代構(gòu)建一組跨越與ISCB和ISRB相關(guān)的所有主要RNA組的wRNA譜,我們發(fā)現(xiàn)不同的wRNA與幾乎所有ISCB和ISRB相關(guān)。此外,不同的IsrB和IscB進化枝與不同的wRNA結(jié)構(gòu)相關(guān)。從isrB到iscB的轉(zhuǎn)變可能伴隨著isrB相關(guān)的wRNA中轉(zhuǎn)座子末端區(qū)域和多莖環(huán)之間的第二個假結(jié),即銜接子假結(jié)的丟失。wRNA結(jié)構(gòu)的復雜性與相關(guān)蛋白質(zhì)大小之間的反比關(guān)系也反映在與大ISCB的進化枝相關(guān)的簡化的wRNA結(jié)構(gòu)和與大Cas9s相關(guān)的甚至更小的tracrRNA上。圖4:IscB系統(tǒng)的演變與多樣性。

除了產(chǎn)生豐富多樣的II型CRISPR系統(tǒng)的進化事件的獨特連續(xù)性之外,系統(tǒng)發(fā)育分析還揭示了IscB和相關(guān)蛋白進化中的其他幾個事件導致了現(xiàn)存的多樣性。首先在真核生物基因組中搜索了IscB同源物,并在陸地綠藻Ignatius tetrasporus UTEX B 2012的葉綠體基因組中鑒定了多個IscB基因座。盡管ORF在大多數(shù)這些基因座中被多個終止密碼子破壞,但一個基因座編碼完整的IscB(與相關(guān)的原核IscB具有約50%的氨基酸同一性)和轉(zhuǎn)錄活性的wRNA。該真核IscB用最小的NNG TAM切割DNA,其不同于其他表征的IscB TAM。其次研究了大型ISCB的進化枝,其中包含一個BH域,該域通過類似REC域的插入被分成兩部分。假設(shè)這些插入可能會增強DNA解旋,類似于Cas9的REC葉,因此將促進真核染色質(zhì)結(jié)構(gòu)復雜景觀中的基因組編輯。在人類基因組中的46個位點上,發(fā)現(xiàn)OgeuIscB在28個這些位點誘導插入缺失,效率高達4.4%。因此,OgeuIscB似乎是進一步開發(fā)基于IscB的基因組編輯工具的有希望的候選者。第三,通過實驗表征了IscB的明顯祖先IsrB的假定核酸酶活性。Kracemifer含有5個與天然表達的WRNA相關(guān)的ISRB。發(fā)現(xiàn)IsrB-wRNA RNP以指導和TAM特異性方式切割dsDNA底物的非靶鏈,這類似于IscB的活性。滅活HNH結(jié)構(gòu)域。最后,試圖確定IS200/IS605轉(zhuǎn)座子是否一般含有RNA引導的核酸酶。除了獨特的IscB和IsrB家族外,大多數(shù)IS200/IS605轉(zhuǎn)座子編碼另一個家族的RuvC樣核酸內(nèi)切酶TnpB,它被認為是V型CRISPR效應(yīng)子Cas12s的祖先。此外,TnpB可能是編碼在不同真核轉(zhuǎn)座子中的較大蛋白質(zhì)Fanzors的祖先。先前的工作已經(jīng)鑒定了與古細菌和細菌中tnpB基因的3'末端重疊的ncRNA,但這些ncRNA的功能尚未表征。K.racemifer的小RNA-seq揭示了與相關(guān)tnpB ORF的3'末端重疊的ncRNA的天然表達,將其歸類為不同的wRNA組。KraTnpB wRNA 3'末端的反向互補幾乎與與一些KraIscBs相關(guān)的wRNA的5'相同,該區(qū)域?qū)?yīng)于每個基因座中預測的轉(zhuǎn)座子末端對含有與KraTnpB聚集的tnpB基因的非冗余基因座的分析顯示,在基因座的3'末端,對應(yīng)于IS200/IS605轉(zhuǎn)座子末端,序列保守性下降。與小RNA-seq跡線的比較顯示表達超出保守下降,表明轉(zhuǎn)錄物中可能存在指導序列。使用重編程的指導對來自該簇的多種TnpB蛋白的體外質(zhì)粒切割測定證明了用5'TAM進行RNA引導的切割。從AmaTnpB重組純化TnpB并證實其可重編程的RNA引導的dsDNA內(nèi)切核酸酶活性。在識別dsDNA或ssDNA底物時,AmaTnpB強力切割含有靶的單鏈DNA(ssDNA)底物并且非特異性切割側(cè)枝底物。圖5:IS200/IS605元件編碼多種RNA引導的核酸酶。



通過探索Cas9進化,發(fā)現(xiàn)了三種高度豐富但以前未表征的轉(zhuǎn)座子編碼核酸酶的可編程RNA引導機制:IscB,IsrB和TnpB,統(tǒng)稱為OMEGA(專性移動元件引導活性),因為移動元素的定位和移動可能決定了他們指南的身份。雖然OMEGA系統(tǒng)的生物學功能尚不清楚,但有幾個假設(shè)與現(xiàn)有證據(jù)相符,包括促進TNP催化,RNA引導轉(zhuǎn)座或作為毒素的作用,轉(zhuǎn)座子作為抗毒素,確保維持IS200/IS605插入。

TnpB家族比IscB家族更加豐富和多樣化,在細菌和古細菌基因組中鑒定了超過100萬個推定的tnpB基因座,使其成為最常見的原核基因之一。這些TNPB可能代表了未開發(fā)的豐富的各種RNA引導機制,不僅存在于原核生物中,而且存在于真核生物中。結(jié)合對葉綠體編碼的IscB的鑒定,這些發(fā)現(xiàn)表明RNA引導系統(tǒng)擴展到真核基因組中可能是一種普遍現(xiàn)象,更廣泛地說,RNA引導系統(tǒng)在功能上是多樣的并且滲透到生命的所有領(lǐng)域。


教授介紹:

張峰

張鋒,男,1982年出生于河北石家莊,2004年畢業(yè)于?哈佛大學,2009在斯坦福大學獲得博士學位,是當今最為人所關(guān)注的華裔生物學家之一。他最著名的工作是基因修飾技術(shù)CRISPR-Cas9的發(fā)展和應(yīng)用,率先獲得了美國專利,并被視為諾貝爾獎的熱門人選之一。2021年10月18日,張鋒教授當選美國國家醫(yī)學科學院院士(National Academy of Medicine,NAM)。張鋒主要研究領(lǐng)域為神經(jīng)系統(tǒng)功能與疾病。他在自然微生物CRISPR系統(tǒng)用于真核細胞(包括人類細胞)的基因編輯工具開發(fā)方面做出了最前沿的探索。通過CRISPR及其他方法,張鋒深入研究了基因和遺傳機制與各種疾病的關(guān)聯(lián),尤其是在神經(jīng)系統(tǒng)紊亂方面。


張鋒于2011年加入MIT,同時在麥戈文腦科學研究所(McGovern Institute)大腦與認知科學部門,以及博德研究所(Broad Institute)從事科研工作。2013年,他的實驗室開發(fā)出創(chuàng)新性CRISPR/Cas系統(tǒng),大幅度提高了編輯基因的可靠性和效率,引起國際關(guān)注,因其突破性的研究成果,他獲得了眾多榮譽。2014年,張鋒被《自然》雜志評選為2013年年度十大科學人物之一;2015年,獲得“年度波士頓人”提名;2016年3月,獲得加拿大蓋爾德納國際獎;2016年,第二屆唐獎生技醫(yī)藥獎;2017年,獲得美國布拉瓦尼克國家青年科學家獎。


參考文獻:

HAN?ALTAE-TRAN,SOUMYA?KANNAN,FENG?ZHANG?etal.The widespread IS200/IS605 transposon family encodes diverse programmableRNA-guided endonucleases[J].SCIENCE, 1 Oct 2021,Vol?374,?Issue?6563,pp57-65

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容