基因組中重復(fù)序列大體分為兩類:
串聯(lián)重復(fù)(Tandem repeats,Tandem Duplication) (TRF可預(yù)測(cè))
散在重復(fù)(Dispersed repeats),也被稱為轉(zhuǎn)座子(TE,transposable element)

? ??在植物中,著絲粒和端粒區(qū)域存在豐富的 逆轉(zhuǎn)座子 (散在重復(fù)I型轉(zhuǎn)座子) 和 串聯(lián)重復(fù)序列(Satellite)。植物著絲粒是基因組中進(jìn)化最劇烈、結(jié)構(gòu)最復(fù)雜的區(qū)域,在物種形成和分化過(guò)程中發(fā)揮重要作用。大多數(shù)植物著絲粒結(jié)構(gòu)復(fù)雜,主要是由高度重復(fù)的衛(wèi)星DNA?(satellite)以及中間穿插的逆轉(zhuǎn)座子序列組成,其中著絲粒satellite序列單元長(zhǎng)度主要集中在150 – 180 bp之間,例如水稻CentO和玉米CentC序列。
????串聯(lián)重復(fù)
? ??TD:? Tandem Duplication? ? TR:? Tandem Repeat?都叫串聯(lián)重復(fù)。串聯(lián)重復(fù)序列是指以相對(duì)恒定的短序列為重復(fù)單位,首尾相接, 串聯(lián)連接形成的重復(fù)序列,又稱衛(wèi)星DNA (satellite DNA)。在人類基因組中,串聯(lián)重復(fù)序列約占10%,主要分布在非編碼區(qū),少數(shù)位于編碼區(qū)。編碼區(qū)中的串聯(lián)重復(fù)序列與功能有關(guān),非編碼區(qū)串聯(lián)重復(fù)序列多分布在間隔DNA或內(nèi)含子,重復(fù)單位短的僅2bp長(zhǎng)的可達(dá)數(shù)十堿基對(duì),重復(fù)次數(shù)少則數(shù)次,多則幾百次。重復(fù)序列的重復(fù)次數(shù)不同,是形成DNA長(zhǎng)度多態(tài)性的基礎(chǔ)。按重復(fù)序列的長(zhǎng)度和序列特征分成大衛(wèi)星DNA、小衛(wèi)星DNA和微衛(wèi)星DNA等主要類型。
????微衛(wèi)星在動(dòng)物里面一般稱為短串聯(lián)重復(fù)序列(short tandem repeats, STRs),一般在植物里面稱為(Simple Sequence Repeats,SSRs)。SSR在植物中經(jīng)常被用作遺傳標(biāo)記使用。
????散在重復(fù)????TE? ? 轉(zhuǎn)座子? ??
轉(zhuǎn)座子 transposable elements (TEs)?是一類能夠在基因組上移動(dòng)其位置的DNA序列。
????可細(xì)分為兩類:I型轉(zhuǎn)座子: retrotransposons(逆轉(zhuǎn)座子);RNA transposons;RNA轉(zhuǎn)座子?????以DNA為模板,轉(zhuǎn)錄為mRNA,mRNA再反轉(zhuǎn)錄為cDNA,在整合酶的作用下插入基因組的新位置。? ??“復(fù)制-粘貼”? ??(逆轉(zhuǎn)錄是指以RNA為模板合成與其互補(bǔ)的cDNA的過(guò)程)
????II型轉(zhuǎn)座子:DNA transposons;DNA轉(zhuǎn)座子? ??????由DNA介導(dǎo)????????“剪切-粘貼”? ? ? ??
? ??轉(zhuǎn)座子按照能否自主移動(dòng),都分為自主型和非自主型。自主型是,TEs只要自身就能在基因組上跳躍,非自主型TE需要另外一個(gè)TE帶著它才能跳躍。非自主型不能獨(dú)立跳躍,是因?yàn)槿鄙俎D(zhuǎn)座酶(對(duì)于II類)或逆轉(zhuǎn)錄酶(對(duì)于I類)。Ac/Ds系統(tǒng)中,Ac是自主型,Ds是非自主型。沒有Ac,Ds自己不能發(fā)揮作用。
????自主型元件通常含有 gag 和pol 兩個(gè)基因,前者負(fù)責(zé)編碼衣殼蛋白,后者負(fù)責(zé)編碼多功能蛋白 ,其具有蛋白酶、反轉(zhuǎn)錄酶、RNase H以及整合酶的活性功能域;非自主型元件缺少完整或大部分轉(zhuǎn)座所需蛋白的編碼基因,其對(duì)應(yīng)于自主元件的區(qū)域由不相關(guān)的序列或宿主序列組成。


? ??TE具有擾亂被介入基因組成結(jié)構(gòu)的潛在可能性,并被認(rèn)為是導(dǎo)致生物基因發(fā)生漸變(有時(shí)候是突變),并最終促使生物進(jìn)化的根本原因。如染色體的 插入insertion ,刪除deletion,以及 易位transposition 是通過(guò)TEs 來(lái)改變的。
? ??宿主盡可能降低轉(zhuǎn)座發(fā)生對(duì)其基因組穩(wěn)定性造成的威脅,轉(zhuǎn)座元件也可以在轉(zhuǎn)錄水平 (transcriptional level) 或轉(zhuǎn)錄后水平上 (post-transcriptional level) 參與鄰近基因的表達(dá)調(diào)控,并能以 “順式” (in cis) 或 “反式” (in trans) 方式調(diào)控內(nèi)源基因表達(dá)。
?????TE對(duì)基因組的影響(部分):
? ? * 插入功能基因,使該基因失活,這便是假基因的來(lái)源
? ??* 插入編碼區(qū)時(shí),它們通常會(huì)引起移碼突變或改變剪切模式,從而改變(大多數(shù)情況下是破壞)蛋白質(zhì)功能
? ??* 插入或靠近調(diào)控區(qū)時(shí),可以改變基因表達(dá)(如轉(zhuǎn)錄時(shí)序或轉(zhuǎn)錄量),或充當(dāng)增強(qiáng)子或其它調(diào)控因子的角色。
????* 許多TE含有啟動(dòng)子來(lái)驅(qū)動(dòng)自己的轉(zhuǎn)座酶轉(zhuǎn)錄。這些啟動(dòng)子可引起連鎖基因的異常表達(dá),從而導(dǎo)致疾病或突變表型。編碼反轉(zhuǎn)錄酶的 TE 有時(shí)不僅能將它們自己 RNA 的 DNA 拷貝(cDNA)插入到宿主基因組內(nèi),還能將其它基因的 RNA 轉(zhuǎn)錄物也插入到宿主基因組內(nèi),這些 RNA 的 cDNA 拷貝(反轉(zhuǎn)錄序列,retrosequence,retrocopy)類似于基因組內(nèi)其它位置的祖先基因的外顯子,只是它們沒有調(diào)控區(qū)和內(nèi)含子。大部分反轉(zhuǎn)錄序列是已加工假基因,并不產(chǎn)生有功能的基因產(chǎn)物。
????* 通過(guò)轉(zhuǎn)錄和不等交換,TE 數(shù)量可增加或減少,從而改變基因組大小。
? ??*?會(huì)增加宿主基因的突變率。

????轉(zhuǎn)座元件對(duì)插入位點(diǎn)基因的影響主要表現(xiàn)為:基因自身功能突變以及新功能化、基因結(jié)構(gòu)變異、核酸序列和表觀遺傳修飾的重新編排等,這些影響最終可能造成表型變異。
????假基因(Pseudogene)
????假基因是一類本來(lái)正常,但后來(lái)因?yàn)橥蛔兓蜣D(zhuǎn)座,而可能失去了原來(lái)功能的基因,常用?ψ?表示。它在序列結(jié)構(gòu)上與功能基因非常相似,但已喪失了正常的蛋白質(zhì)編碼功能。一般情況都不被轉(zhuǎn)錄。
? ??在環(huán)境壓力下,某些假基因可以重新被激活,而某些假基因則有著調(diào)控基因表達(dá)的作用??煽偨Y(jié)為“假作真時(shí)真亦假”。它們與原來(lái)的基因可能很相似,但又可以有很大差異。
????假基因主要分為(重復(fù)假基因)duplicated pseudogene 和 (轉(zhuǎn)座假基因或加工假基因)processed pseudogene or retropseudogene。
????重復(fù)假基因:DNA復(fù)制 或 染色體不均等交換 過(guò)程中基因編碼區(qū)或調(diào)控區(qū)發(fā)生突變(如堿基替換、插入、缺失),導(dǎo)致復(fù)制后的基因喪失正常功能而成為假基因。
????轉(zhuǎn)座子假基因:mRNA反轉(zhuǎn)錄成cDNA插入整合到基因組上,由于插入位點(diǎn)不合適或序列發(fā)生突變而失去正常功能,這樣形成的假基因稱為加工假基因或轉(zhuǎn)座假基因。
????假基因的數(shù)量與選擇壓力和轉(zhuǎn)座子的活性有關(guān),選擇壓力越大,轉(zhuǎn)座子活性高,反轉(zhuǎn)錄成的轉(zhuǎn)座假基因越多。所以一般情況下,假基因的Ka/Ks比較高。假基因的功能主要是在RNA水平上,類似于ncRNA。
? ? 逆轉(zhuǎn)座子
????目前主要存在兩種類型RNA轉(zhuǎn)座子(逆轉(zhuǎn)座子):
LTR (Long Terminal Repeat retrotransposons)????長(zhǎng)末端重復(fù)反轉(zhuǎn)錄轉(zhuǎn)座子????雙末端都是長(zhǎng)重復(fù)序列? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
non-LTR TEs????雙末端缺乏重復(fù)序列????LINE和SINE
????LINE 元件的編碼區(qū)由 ORF1 和ORF2 共同構(gòu)成,ORF1 與 gag基因編碼的產(chǎn)物類似,ORF2 則含有內(nèi)切酶(EN)和反轉(zhuǎn)錄酶(RT)的編碼基因。LINE 和 SINE 均以簡(jiǎn)單的序列重復(fù)結(jié)尾,通常有poly(A)。對(duì)所有已知 SINE 分析發(fā)現(xiàn),它們的近 5 ‘端都含有一個(gè)潛在的 RNA pol III 啟動(dòng)子,而除了 3' 端的序列與 LINE 同源外,其余部分的特征還不清楚,暗示SINE 在基因組中作為非自主元件,可能借助LINE 的自主轉(zhuǎn)座機(jī)制進(jìn)行自我復(fù)制。LINE 在植物中的比例較低,而 SINE 則以高拷貝形式存在。
? ??以人類轉(zhuǎn)座子為例:人體大約有40%的DNA和逆轉(zhuǎn)錄病毒有關(guān)。其中7.7%的DNA和逆轉(zhuǎn)錄病毒的DNA非常的相似,我們稱之為內(nèi)源逆轉(zhuǎn)錄病毒(endogenous retrovirus,ERV)。逆轉(zhuǎn)錄病毒的DNA結(jié)構(gòu)可以用下面這張圖表示:

????病毒兩端有兩條相同的序列,稱為LTR(long terminal repeat)。LTR沒有編碼任何蛋白,主要起到調(diào)控的作用。中間是三段基因:gag,pol和env。gag編碼了衣殼蛋白等結(jié)構(gòu)蛋白,pol編碼了逆轉(zhuǎn)錄酶,整合酶,蛋白酶這些病毒復(fù)制需要的酶,env編碼了病毒包膜的糖蛋白。所有的逆轉(zhuǎn)錄病毒都有這三個(gè)基因。人類的內(nèi)源逆轉(zhuǎn)錄病毒(HERV)也有這三段基因和兩個(gè)LTR,也可以像逆轉(zhuǎn)錄病毒那樣,把自己逆轉(zhuǎn)錄再整合到別的地方,就像復(fù)制-粘貼一樣。人們認(rèn)為HERV是很久以前逆轉(zhuǎn)錄病毒偶然感染了人類的胚胎,結(jié)果永久性的成為人的基因組的一部分。經(jīng)過(guò)這么多年的擴(kuò)增達(dá)到了7.7%的規(guī)模。但人類的ERV不知道什么原因已經(jīng)變異失去了制造新的病毒顆粒的能力。
????還有0.6%的片段含有LTR和gag,pol,但不含有env。由于不含有env,無(wú)法獲得包膜,也就無(wú)法形成病毒顆粒。這些片段被稱為逆轉(zhuǎn)錄轉(zhuǎn)座子(retrotransposon)。人們猜測(cè)這類轉(zhuǎn)座子是逆轉(zhuǎn)錄病毒的來(lái)源,逆轉(zhuǎn)錄轉(zhuǎn)座子通過(guò)偶然的機(jī)會(huì)獲得了env的基因,從而產(chǎn)生了最早的逆轉(zhuǎn)錄病毒。
????剩下的是不含LTR的和逆轉(zhuǎn)錄有關(guān)的DNA片段。其中16.9%的被稱為L(zhǎng)INE的DNA也有編碼和逆轉(zhuǎn)錄酶,整合酶相似活性的酶。人們認(rèn)為L(zhǎng)INE也可以像ERV,逆轉(zhuǎn)錄轉(zhuǎn)座子那樣逆轉(zhuǎn)錄,整合到別的地方,它們也占據(jù)了最大的比例。還有10.6%的沒有編碼逆轉(zhuǎn)錄酶,稱為SINE。人們猜測(cè)SINE是在LINE的輔助下進(jìn)行逆轉(zhuǎn)錄和整合的。但不管怎么說(shuō),SINE也占據(jù)了相當(dāng)大的一部分。這些不含有LTR的片段總共占據(jù)了33.9%的人類基因組。
????總之,人們猜測(cè)ERV是遠(yuǎn)古逆轉(zhuǎn)錄病毒感染人類胚胎留下來(lái)的,而逆轉(zhuǎn)錄轉(zhuǎn)座子可能是逆轉(zhuǎn)錄病毒的起源。
? ??LTR-RTs 的結(jié)構(gòu)特征
?????典型的 LTR-RTs 的結(jié)構(gòu)有 5 個(gè)特征,各特征意義如下:


? ??(1) TSD:目標(biāo)重復(fù)位點(diǎn),是 4~6bp 的短的重復(fù)序列,在 5’LTR and 3’LTR 兩側(cè),是LTR轉(zhuǎn)座子插入的信號(hào)。
? ??大多數(shù)TEs(全部LTR,TIR;某些LINE, SINE)的轉(zhuǎn)座過(guò)程在整合位點(diǎn)的宿主DNA中產(chǎn)生目標(biāo)位點(diǎn)復(fù)制(TSD),因此識(shí)別與TE相鄰的TSD可以確定轉(zhuǎn)座。
? ??(2) 5’LTR and 3’LTR : ?LTR 兩端序列完全一致的末端重復(fù), TG..CA box,完整的 LTR 均含有此結(jié)構(gòu)。LTR 長(zhǎng)度一般在 85~5000bp。
? ??(3) PBS(primer binding site) 引物結(jié)合位點(diǎn): 在 5’LTR 的末端,可與一些 tRNA 3’ 末端互補(bǔ)結(jié)合的一段 18bp 左右的序列,是反轉(zhuǎn)錄的第一步。?
? ??(4)?蛋白區(qū)域: 長(zhǎng)度通常在 1000~15000bp。 GAG:衣殼蛋白。 POL:包含 4 種酶,有AP(天冬氨酸酶)、IN(INT,整合酶)、RT(逆轉(zhuǎn)錄酶)、RH(核糖核酸酶),LTR 能否自主轉(zhuǎn)座的關(guān)鍵原因。 ENV:包膜蛋白,后生動(dòng)物中存在。?
? ??(5) PPT:3’LTR 的起始位置短的富含嘌呤的序列,11~15bp。
????LTR 類反轉(zhuǎn)錄轉(zhuǎn)座子通過(guò)一個(gè)復(fù)雜的過(guò)程在細(xì)胞內(nèi)完成復(fù)制。 以 Ty1-Copia 為例, GAG 和 pol 所編碼的蛋白作為一個(gè)多蛋白合成, 其中由 pol 編碼的天冬氨酸蛋白酶(AP) 將這個(gè)多蛋白切割成單個(gè)的功能蛋白, 轉(zhuǎn)座子 mRNA上的 PBS(引物結(jié)合位點(diǎn)) 與宿主細(xì)胞 RNA(通常為 tRNA 的 3’末端) 互補(bǔ),mRNA 與合成的 tRNA 的體內(nèi)雜交為轉(zhuǎn)座提供一個(gè)短的雙鏈 RNA 區(qū)域, 該區(qū)域tRNA 的 3’末端具有自由羥基, 反轉(zhuǎn)錄酶到達(dá)轉(zhuǎn)座子 mRNA 的 5’末端, 利用 tRNA的 3’末端為引物, 合成 DNA 互補(bǔ)鏈, 完成 DNA 第 1 條鏈的合成, 然后通過(guò) RNA酶 H 消化 RNA:DNA 雜交鏈中的 RNA 鏈, 釋放單鏈 DNA, 再以 PPT(多嘌呤位點(diǎn)) 為引物合成 DNA 第 2 條鏈, 形成雙鏈 DNA, 雙鏈 DNA 一旦形成, 整合酶就將 DNA 整合到染色體的新位置上, 完成轉(zhuǎn)座的過(guò)程。 這些蛋白通過(guò)協(xié)同合作共同完成將轉(zhuǎn)座子的子拷貝插入到宿主基因組中的任務(wù)。
????Kumar A, Bennetzen JL 1999. Plant Retrotransposons [J]. Annu Rev Genet, 33:479-532.????來(lái)源:碩士論文?LTR 類反轉(zhuǎn)錄轉(zhuǎn)座子在棉花中的生物學(xué)功能研究(中文表述不知是否準(zhǔn)確)
? ? Analysis of the chromatin binding affinity of retrotransposases reveals novel roles in diploid and tetraploid cotton
????在植物基因組中,I類轉(zhuǎn)座因子,LTR-RT (LTR retrotransposons) 是基因組擴(kuò)張的主要原因。LTR 在生物體內(nèi)歷經(jīng)成千上萬(wàn)年的進(jìn)化,發(fā)展出許多存在形式。通常將包含兩個(gè)相對(duì)完整的 LTRs 和已識(shí)別的 PPT 和 PBS 位點(diǎn)的元素,且兩側(cè)有 TSD (target site duplications) 的 LTR 定義為 Intact LTR(A)。由于 LTR-RTs 兩端序列非常相似,LTR-RTs 內(nèi)可發(fā)生重組,導(dǎo)致內(nèi)部元件消失,形成 solo LTR(C),而?solo?LTR 的數(shù)量表明了一個(gè)基因組中 LTR 去除的速率。此外 LTR 發(fā)生?缺失、易位?可形成 truncated 截?cái)?的 LTR(B)。LTR 也會(huì)經(jīng)常插入到其他 LTR 內(nèi)部區(qū)域,形成 嵌套 LTR(D)。
? ??因存在這些突變機(jī)制,實(shí)際上完整的 LTR-RTs (A)只占基因組中所有 LTR-RT 相關(guān)序列的一小部分,完整的 LTR 長(zhǎng)度在85~5000 bp之間。 Intact LTR 主要?dú)w為兩大類: Gypsy和Copia。如果LTR中間的序列不包含開放閱讀框(ORF), 那么所屬的LTR-RT就無(wú)法獨(dú)立的轉(zhuǎn)座。

????DNA轉(zhuǎn)座子
????DNA轉(zhuǎn)座子可以分為4類:1)DDE轉(zhuǎn)座酶介導(dǎo)的剪切粘貼轉(zhuǎn)座:如Tc1/Mariner,P元件;2)酪氨酸轉(zhuǎn)座酶轉(zhuǎn)座子,即Cryptons;3)Helitron;4)Mavericks(也即,Polinton)
????DNA轉(zhuǎn)座子其序列兩端是兩段直接重復(fù)序列(direct repeat, dR),與它們接壤的是末端反向重復(fù)序列(terminal inverted repeat,TIR)和靶位點(diǎn)重復(fù)序列(target site duplication,TSD),其中非自主元件也被看作是自主型轉(zhuǎn)座子發(fā)生內(nèi)在編碼序列缺失的形式。微型反向重復(fù)轉(zhuǎn)座元件 (miniatureinverted-repeat transposable element,MITE)是非自主元件中拷貝數(shù)最多的轉(zhuǎn)座子,盡管它們不能自主轉(zhuǎn)座,但在動(dòng)、植物物種均以高拷貝形式存在。非自主元件的另一個(gè)重要特征是它們能夠攜帶宿主的基因片段發(fā)生轉(zhuǎn)座。
? ? 前兩類(DDE和Cryptons)的轉(zhuǎn)座比較簡(jiǎn)單,結(jié)構(gòu)構(gòu)成只有一個(gè)開放閱讀框,編碼重組酶,兩端含有短末端倒置重復(fù)序列(TIRs)。Cryptons在真核生物中分布較少;DDE類轉(zhuǎn)座子是所有TE中分布最廣,種類最多的一類轉(zhuǎn)座元件,其至少包含了17個(gè)超家族。甚至可以說(shuō),DDE是地球上最古老、最豐富的的基因。
? ??Helitrons 轉(zhuǎn)座子是近年來(lái)發(fā)現(xiàn)的一種新型 DNA 轉(zhuǎn)座子,在黑腹果蠅、線蟲、擬南芥等物種中廣泛存在。它的結(jié)構(gòu)很簡(jiǎn)單,沒有短末端倒置重復(fù)序列(TIRs)等經(jīng)典DNA轉(zhuǎn)座子結(jié)構(gòu),不能自主移動(dòng),沒有“剪切粘貼”。
?????轉(zhuǎn)座子在物種間分布的差異
? ??TE在物種中的含量和物種基因組復(fù)雜程度無(wú)關(guān),有些復(fù)雜的多細(xì)胞生物(如針葉樹、蠑螈等)可以含有較多的TE,但是有些單細(xì)胞生物(比如陰道毛滴蟲、Anncaliia algerae等)也會(huì)含有較多的TE。

????有些研究認(rèn)為,物種中TE的含量和其物種的有效群體數(shù)量(在一個(gè)理想群體中,在隨機(jī)遺傳漂變影響下,能夠產(chǎn)生相同的等位基因分布或者等量的近親交配的個(gè)體數(shù)量)相關(guān)。有效群體數(shù)量越大,自然選擇效能越高,因而對(duì)TE的選擇壓力也越大。比如,在有效群體數(shù)量很大的果蠅中,TE含量較低,而在有效群體數(shù)量較小的脊椎動(dòng)物中,TE插入受到選擇壓力較小,可以很快的在群體中固定下來(lái)。不過(guò),有些有效群體數(shù)量相近的物種, 其TE含量有時(shí)也會(huì)有很大差異。所以有效群體數(shù)量的差異并不足解釋TE的分布差異。
????(小的群體中,由于不同基因型個(gè)體生育的子代個(gè)體數(shù)有所變動(dòng)而導(dǎo)致基因頻率的隨機(jī)波動(dòng)稱為遺傳漂變)
????而且各類不同的TE分布差異也很大,比如LTR在開花植物中分布很多;non-LTR在哺乳動(dòng)物中分布很多;DNA轉(zhuǎn)座子在斑馬魚和線蟲中分布很多。有效群體數(shù)量的差異也不足以解釋這一現(xiàn)象。
????雖然水稻、玉米和擬南芥中的DNA 甲基化整體變化趨勢(shì)相似,但它們之間仍然存在差異,這種差異與轉(zhuǎn)座元件的組成密切相關(guān)。轉(zhuǎn)座元件的擴(kuò)增可能是造成 DNA 甲基化修飾變化的潛在原因。在不同植物中,轉(zhuǎn)座元件差異所帶來(lái)的基因組結(jié)構(gòu)變異,可能是塑造植物表觀基因(epigenomics)的重要原因。
????TE含量和基因組大小
????除了極少數(shù)已知真核生物外(瘧原蟲、弓形蟲、腸腦炎微孢子蟲、泰勒原蟲),所有的真核生物物種中都含有TE。巧合的是,上述幾種例外都是單細(xì)胞生物,而且后兩者是真核生物中基因組最小的。轉(zhuǎn)座元件所占比例與基因組大小存在著一定的正相關(guān)性。
????在一些較大的基因組中,比如蠑螈基因組,其大小有120Gb。這么大的基因組主要是LTR轉(zhuǎn)座元件造成的。植物基因組通常也可以通過(guò)轉(zhuǎn)座元件迅速增大。其中涉及的轉(zhuǎn)座元件可能涵蓋較多的TE家族,但是個(gè)別TE的作用可能會(huì)格外顯著。比如棕水螅在3600萬(wàn)年前從綠水螅中分化出來(lái),隨后其基因組大小從300Mb迅速增大到了1Gb,造成這一現(xiàn)象的原因就是CR1 non-LTR轉(zhuǎn)座子。
????非必要DNA的刪除是另一個(gè)決定基因組大小和TE含量的因素。除了轉(zhuǎn)座元件外,蠑螈形成的大基因組和其較低的DNA刪除率也有很直接的關(guān)系。在擬南芥和水稻中,異位重組造成的基因組高刪除率抵消了轉(zhuǎn)座造成的基因組擴(kuò)大,維持了擬南芥和水稻的基因組大小穩(wěn)定。在鳥類和哺乳動(dòng)物中,也有同樣的現(xiàn)象。
????TE多樣性
????TE在物種之間的分布,除了豐度不同外,種類分布也存在很大差異。宿主和TE之間的競(jìng)爭(zhēng)作用會(huì)導(dǎo)致TE家族結(jié)構(gòu)的形成,擴(kuò)大TE的亞家族種類(比如L1)。其他一些轉(zhuǎn)座元件,比如Helitrons可以通過(guò)獲取宿主DNA的片段形成新的亞家族。
????不管在什么尺度來(lái)衡量,真核生物的TE分布都具有很高的多樣性。比如在斑馬魚中,其TE豐度和多樣性在脊椎模式生物中都是最高的,含有近2000個(gè)TE家族,涵蓋了所有的亞綱和幾乎所有的超家族。其中,DNA轉(zhuǎn)座子特別豐富,含有1000個(gè)不同時(shí)期形成的DNA轉(zhuǎn)座子家族,這在魚類中很不尋常。
????但是這并不是說(shuō)基因組越大,其TE多樣性越高。比如云杉是一類裸子植物,其基因組大小20Gb,其中的轉(zhuǎn)座子主要集中在LTR超家族中,含有大量的拷貝數(shù)。而且其中的大多數(shù)轉(zhuǎn)座子發(fā)生在500萬(wàn)-6000萬(wàn)年前。在水稻和玉米中,所有的轉(zhuǎn)座子都晚于500萬(wàn)年。這說(shuō)明盡管TE在云杉中的多樣性很低,但是很多已經(jīng)存在基因組中的TE會(huì)被緩慢的移除掉。與云杉相反,在很多開花植物中,盡管其基因組很小,但是其TE的多樣性卻很高。甚至在所有陸生植物中,基因組大小和TE多樣性還表現(xiàn)出負(fù)相關(guān)關(guān)系。
? ??TE家族的劃分一般按照 80-80-80 方法,即如果兩個(gè)TE插入的序列長(zhǎng)度都超過(guò)80bp,有超過(guò)80%的序列的相似性超過(guò)80%,那么我們可以認(rèn)為這兩個(gè)TE是來(lái)自同一個(gè)家族。因?yàn)樾蛄邢嗨菩员容^高,該家族的TE可以用一個(gè)共同的序列來(lái)表示該家族共同祖先的序列。特別是當(dāng)該家族的TE在較短時(shí)間內(nèi)經(jīng)歷了爆發(fā),并且這些TE只經(jīng)歷了中性選擇的時(shí)候。但是,也有些時(shí)候根據(jù) 80-80-80 原則定義的家族和其共同序列并不能夠反映各個(gè)TE間真實(shí)的進(jìn)化關(guān)系。
????轉(zhuǎn)座元件的進(jìn)化起源
? ??TE的進(jìn)化關(guān)系和物種進(jìn)化關(guān)系并不一致,TE可以進(jìn)行物種之間的水平轉(zhuǎn)移,甚至是在脊椎動(dòng)物和無(wú)脊椎動(dòng)物之間長(zhǎng)距離的轉(zhuǎn)移。有些TE在進(jìn)化的過(guò)程中可能丟失或滅絕了。所以,研究轉(zhuǎn)座元件之間的進(jìn)化關(guān)系非常困難。
????在過(guò)去數(shù)十年的研究中,人們發(fā)現(xiàn),所有主要轉(zhuǎn)座元件的亞綱subclass在真核生物進(jìn)化分支中均有分布。對(duì)TE核心蛋白的分析也顯示這些亞綱在真核生物進(jìn)化早期就已經(jīng)存在。同時(shí)TE的進(jìn)化是高度模塊化的,可以反復(fù)獲得或者丟失某些蛋白模塊。
????盡管各種不同元件的結(jié)構(gòu)非常多樣,但是在復(fù)制和轉(zhuǎn)座過(guò)程中涉及的蛋白種類卻很有限,大概可以分為5類:逆轉(zhuǎn)錄酶RT,整合酶IN,酪氨酸重組酶YR,HUH/Rep,DNA合成酶pPolB
????轉(zhuǎn)座子在基因組上的分布并不隨機(jī)
????對(duì)于不同類型的轉(zhuǎn)座子,基因組可以看成是其生態(tài)系統(tǒng),轉(zhuǎn)座子通過(guò)與基因組環(huán)境以及和其他轉(zhuǎn)座子之間復(fù)雜的相互作用,實(shí)現(xiàn)轉(zhuǎn)座子自身的擴(kuò)增。這種相互作用類似于生態(tài)學(xué)中的寄生、共生、競(jìng)爭(zhēng)等關(guān)系。因而,轉(zhuǎn)座子在基因組上的分布也并非完全隨機(jī)分布。
????自然選擇和遺傳漂變對(duì)轉(zhuǎn)座子的分布有重要影響。一般情況下,插入事件對(duì)宿主多是有害的,自然選擇會(huì)將其從群體中移除。某些對(duì)宿主適應(yīng)性影響不大的轉(zhuǎn)座子在遺傳漂變的作用下,可能會(huì)在群體中固定下來(lái)。這也解釋了為什么基因組中有些區(qū)域富集轉(zhuǎn)座子,有些區(qū)域則很少含有轉(zhuǎn)座子。
????比如,在人類基因組中,逆轉(zhuǎn)座子LINE1 (L1)是能夠發(fā)生在人類基因的外顯子中的,但是人類基因外顯子中卻很少發(fā)現(xiàn)L1。究其原因,還是外顯子的轉(zhuǎn)座插入給宿主帶來(lái)了較大的危害,自然選擇傾向于將其淘汰。研究還發(fā)現(xiàn),轉(zhuǎn)座子在不同哺乳動(dòng)物進(jìn)化分支上的分布是相對(duì)保守的,即不同物種的基因組中,轉(zhuǎn)座子的分布比較相似。
? ??很多TE插入表現(xiàn)出很強(qiáng)的位點(diǎn)偏倚,傾向于選擇那些不會(huì)影響細(xì)胞功能的基因組位點(diǎn)進(jìn)行插入。轉(zhuǎn)座子的插入還會(huì)受到自然選擇壓力,如果插入對(duì)宿主細(xì)胞造成嚴(yán)重傷害,則這種轉(zhuǎn)座插入不利于轉(zhuǎn)座子本身。更有一些極端的轉(zhuǎn)座子只能在特定的基因組序列中插入,以便在最大可能減少對(duì)宿主的傷害。
????不同類型的轉(zhuǎn)座子在基因組的位置具有一定的偏好,如Copia和Gypsy富集在基因組著絲粒區(qū)域,MITEs 偏愛插入到基因區(qū)間。一些轉(zhuǎn)座子可以介導(dǎo)miRNA形成,例如一些MITEs轉(zhuǎn)座子的回文結(jié)構(gòu),具有轉(zhuǎn)錄成miRNA的可能性
? ??基因間的“垃圾”序列為TE的插入和長(zhǎng)期存在提供了一個(gè)安全的場(chǎng)所。比如在酵母菌中,LTR轉(zhuǎn)座子的插入會(huì)避開宿主基因組的基因序列。Copia和Gypsy通過(guò)趨同進(jìn)化,能夠選擇在Pol-III轉(zhuǎn)錄基因序列的上游插入,避免干擾宿主基因表達(dá)。
? ??很多TE的插入靶標(biāo)位于基因5'端的上游,這種靶標(biāo)選擇傾向會(huì)給TE自身帶來(lái)益處。首先在該區(qū)域的插入能夠避免插入對(duì)編碼蛋白的干擾,同時(shí)這些區(qū)域的染色體多以染色質(zhì)形態(tài)存在,有利于TE自身的表達(dá)和轉(zhuǎn)座。很多物種DNA轉(zhuǎn)座子都采用了這種策略來(lái)實(shí)現(xiàn)自身利益最大化,比如果蠅中的P元件、玉米中的MuDR,大米中的mPing和擬南芥中的VANDAL21等。
????在擬南芥和其他一些植物中,類Copia的逆轉(zhuǎn)座子也進(jìn)化出了一些機(jī)制,實(shí)現(xiàn)在宿主非必需基因中插入。這些機(jī)制主要是通過(guò)識(shí)別核小體組蛋白H2A.Z來(lái)實(shí)現(xiàn)的,該組蛋白不存在于必需基因組中,只存在于和適應(yīng)環(huán)境壓力相關(guān)的非必需基因中。這也提示,TE非隨機(jī)插入帶來(lái)的基因組突變可能也有利于宿主適應(yīng)外界環(huán)境的變化。
? ??還有一種TE的插入策略比較特殊,它們傾向于選擇其他的TE序列作為自己的插入靶點(diǎn)。
????這一系列的證據(jù)都在說(shuō)明,轉(zhuǎn)座子基因組上的分布受到轉(zhuǎn)座子自身特性和宿主基因組選擇壓力的共同作用,從而使其在基因組上的分布并非隨機(jī)。
? ??
????影響TE長(zhǎng)期存在的因素
????所有的新TE插入都會(huì)受到來(lái)自宿主水平的自然選擇。特別是當(dāng)TE對(duì)宿主產(chǎn)生有害作用時(shí),比如:干擾到宿主基因的表達(dá);TE表達(dá)產(chǎn)物對(duì)宿主細(xì)胞有毒副作用;同家族TE導(dǎo)致的宿主染色體異位重組。
? ??TE導(dǎo)致的異位重組是限制TE增殖的主要因素。減數(shù)分裂過(guò)程中未對(duì)齊的同源染色體之間發(fā)生的不平等交叉引起的復(fù)制稱為異位重組。
????序列較長(zhǎng)的TE更容易造成異位重組,因而其受到的選擇壓力也應(yīng)該更大。實(shí)驗(yàn)觀測(cè)也確實(shí)如此,比如LTR和LINE等較長(zhǎng)的轉(zhuǎn)座子常常會(huì)聚集在低重組區(qū)(中心粒?周圍的異染色質(zhì)區(qū),中心粒大部分植物沒有),在這些區(qū)域內(nèi),TE受到的選擇壓力會(huì)相對(duì)較小。與之相反,一些較短的轉(zhuǎn)座子,比如SINE和MITE,通常富集在基因較多的染色體區(qū)域,這些區(qū)域通常重組率也比較高。
????第二個(gè)導(dǎo)致TE受到選擇的因素是其對(duì)基因表達(dá)的影響。可自主移動(dòng)的轉(zhuǎn)座子其自身通常會(huì)含有啟動(dòng)子和調(diào)節(jié)序列,如果其插入到基因序列中,那么對(duì)宿主基因的表達(dá)會(huì)產(chǎn)生較大影響。比如,在人類基因組中,L1轉(zhuǎn)座子很少出現(xiàn)在基因序列中,比較老的LTR插入也很少出現(xiàn)在基因序列兩側(cè)5kb的的范圍內(nèi)。這都證明了攜帶啟動(dòng)子的LTR在人類基因組中受到很強(qiáng)的自然選擇壓力。即便有些插入出現(xiàn)在基因中,也常常是內(nèi)含子中,而且是內(nèi)含子的中段部分,以盡量避免對(duì)外顯子的影響。
????當(dāng)然,還要說(shuō)明一點(diǎn),TE并不一定只給宿主帶來(lái)壞處,還有可能給宿主帶來(lái)適應(yīng)優(yōu)勢(shì),比如果蠅中Doc(non-LTR)的插入導(dǎo)致了Cyp6g1基因表達(dá)增加,該基因提高了宿主對(duì)DDT等殺蟲劑的抗藥性。
????轉(zhuǎn)座子造成突變和基因多態(tài)
????轉(zhuǎn)座子在物種基因組中占有較大的比例。在人類基因組中,轉(zhuǎn)座子占44%;在玉米中,其基因組有60%-70%是由LTR逆轉(zhuǎn)座子組成的,有些還是物種獨(dú)有的。
????黑腹果蠅中的一些轉(zhuǎn)座子在擬果蠅的同源位點(diǎn)卻不存在,說(shuō)明這些轉(zhuǎn)座是新發(fā)的??梢姾芏噢D(zhuǎn)座子還很活躍,轉(zhuǎn)座過(guò)程是導(dǎo)致基因組突變的一個(gè)重要原因。在實(shí)驗(yàn)室中,有超過(guò)一半的黑腹果蠅表型突變是由于各種不同的轉(zhuǎn)座子轉(zhuǎn)座插入導(dǎo)致的。同樣的,在實(shí)驗(yàn)室小鼠群體中,也有10%-15%的表型突變是由于LTR轉(zhuǎn)座子導(dǎo)致的。而且,這一估計(jì)可能還是比較保守的,研究顯示,當(dāng)物種在較大生存壓力的條件下,轉(zhuǎn)座的發(fā)生頻率會(huì)更高。因而,對(duì)于野外自然種群,轉(zhuǎn)座導(dǎo)致的突變可能比實(shí)驗(yàn)室種群更為普遍。
????在群體中固定下來(lái)的轉(zhuǎn)座子,隨著時(shí)間的流逝,這些轉(zhuǎn)座子會(huì)被各種點(diǎn)突變侵蝕,并且最終導(dǎo)致轉(zhuǎn)座子失去轉(zhuǎn)座能力。比如,在人類單倍體基因組中,有~500000個(gè)L1拷貝,但是其中的99.9%是在群體中固定下來(lái)的,并且由于各種突變的累積,這些L1轉(zhuǎn)座子不再具有轉(zhuǎn)座活性。猶如一座死火山存在于人類的基因組中。
????研究估計(jì),每個(gè)人還含有100個(gè)具有活性的L1拷貝,這些L1拷貝還很年輕,在人群中還沒有進(jìn)化固定下來(lái)。所以,人類的參考基因組并不能表示其含有人類所有的轉(zhuǎn)座子。任何兩個(gè)人類單倍體基因組大概都有1000個(gè)不同的轉(zhuǎn)座插入,這些轉(zhuǎn)座插入主要是L1轉(zhuǎn)座子和Alu轉(zhuǎn)座子。在其他物種,比如玉米,其各個(gè)基因組的轉(zhuǎn)座差異可能更大。
????另外,轉(zhuǎn)座子的水平轉(zhuǎn)移也是非常普遍的,幾乎涉及到每一個(gè)物種。目前這種水平轉(zhuǎn)移的機(jī)制還尚待進(jìn)一步研究。
????轉(zhuǎn)座子影響基因重排
????轉(zhuǎn)座子會(huì)導(dǎo)致基因組的增大, 這在一定程度上抵消了基因組的刪除變異導(dǎo)致的基因組變小。兩個(gè)作用共同維持了真核生物基因組大小的相對(duì)穩(wěn)定。但是轉(zhuǎn)座子的插入并非精確,轉(zhuǎn)座過(guò)程又是會(huì)影響到周邊的宿主序列,從而導(dǎo)致宿主序列的重復(fù)和重排,而且可能會(huì)影響到功能基因或者其調(diào)控序列。比如,有研究發(fā)現(xiàn)在大米中,MULE的DNA轉(zhuǎn)座子導(dǎo)致了1000個(gè)基因片段的重排。
????除了上述轉(zhuǎn)座直接帶來(lái)的基因重排外,轉(zhuǎn)座子還會(huì)給基因組帶來(lái)很多散布的重復(fù)序列。即便是轉(zhuǎn)座子本身失去轉(zhuǎn)座能力,其帶來(lái)的重復(fù)序列也是誘導(dǎo)基因組結(jié)構(gòu)變異的因素之一。比如基因重組,重復(fù)序列使得非同一位置的交叉互換成為可能,因而導(dǎo)致較大規(guī)模的序列缺失、序列重復(fù)和序列倒位。
????轉(zhuǎn)座子可能形成特性的染色體結(jié)構(gòu)。雙翅目昆蟲在進(jìn)化過(guò)程中端粒酶丟失,但是在果蠅中,人們發(fā)現(xiàn)類似LINE的逆轉(zhuǎn)座子起到了類似端粒酶的作用,形成并維持了果蠅染色體的端粒。事實(shí)上,很多人也認(rèn)為端粒酶中的逆轉(zhuǎn)錄酶起源于逆轉(zhuǎn)錄元件的一個(gè)古老分支。
????轉(zhuǎn)座表達(dá)和轉(zhuǎn)座抑制
????為了在進(jìn)化中得到持續(xù),轉(zhuǎn)座子必須在表達(dá)和抑制中尋找到平衡。轉(zhuǎn)座子的過(guò)度表達(dá)可能會(huì)給宿主基因組帶來(lái)過(guò)多的害處,從而也不利于轉(zhuǎn)座子自身的維持。這也是為什么很多轉(zhuǎn)座相關(guān)的酶并不處于其最活躍狀態(tài),也解釋了為什么很多轉(zhuǎn)座子含有自身調(diào)控機(jī)制。
????此外,宿主本身也還有很多調(diào)控轉(zhuǎn)座的機(jī)制,比如小RNA的形成,染色質(zhì)的形成,DNA修飾,以及一些抑制轉(zhuǎn)座的因子。但是宿主抑制轉(zhuǎn)座的機(jī)制并不能長(zhǎng)期存在,還要考慮到細(xì)胞本身基因表達(dá)的需要,比如在胚胎發(fā)育早期,宿主要避免過(guò)度的轉(zhuǎn)座抑制,否則會(huì)影響到自身發(fā)育。再比如,在生殖系細(xì)胞形成過(guò)程中,基因組大量DNA去甲基化(去除“遺傳印記”),這對(duì)轉(zhuǎn)座子是一個(gè)千載難逢的好機(jī)會(huì),去甲基化的DNA有利于轉(zhuǎn)座的發(fā)生。
????針對(duì)不同的組織和生命階段,轉(zhuǎn)座對(duì)宿主的影響也存在很大差異。在轉(zhuǎn)座子看來(lái),應(yīng)該盡量避免在體細(xì)胞中表達(dá),在體細(xì)胞中表達(dá)不能傳遞給下一代,對(duì)轉(zhuǎn)座子自身的維持和進(jìn)化無(wú)益。一些研究也確實(shí)如此,證明了轉(zhuǎn)座更加傾向于在生殖系細(xì)胞中發(fā)生。
????轉(zhuǎn)座子在體細(xì)胞和生殖系細(xì)胞中導(dǎo)致的突變
????和其他很多物種類似,在人類中,轉(zhuǎn)座表達(dá)和轉(zhuǎn)座抑制仍然是在一個(gè)動(dòng)態(tài)競(jìng)爭(zhēng)過(guò)程。比如L1逆轉(zhuǎn)座子依賴于其編碼的逆轉(zhuǎn)座蛋白。這些逆轉(zhuǎn)座在人類生殖系細(xì)胞中的插入是導(dǎo)致遺傳病的原因之一。研究顯示,有超過(guò)120個(gè)獨(dú)立轉(zhuǎn)座插入是和人類疾病相關(guān)的。對(duì)于L1轉(zhuǎn)座子,其在人類生殖系新發(fā)生的概率是每95個(gè)新生兒中有1個(gè),對(duì)于Alu轉(zhuǎn)座子(Alu元件是人類基因組中豐度最高的轉(zhuǎn)座元件,非LTR SINEs類),其發(fā)生概率是每21個(gè)新生兒中有1個(gè)。
????既往對(duì)轉(zhuǎn)座子的研究多集中于生殖系細(xì)胞中,因?yàn)轶w細(xì)胞轉(zhuǎn)座對(duì)進(jìn)化意義不大。但是實(shí)際上,轉(zhuǎn)座子在體細(xì)胞中仍然是比較活躍的。在人類中,L1的表達(dá)和轉(zhuǎn)座在不同的體細(xì)胞中都有發(fā)生,包括早期胚胎細(xì)胞和某些干細(xì)胞。在哺乳動(dòng)物大腦中,一些轉(zhuǎn)座子也有發(fā)生。但是研究體細(xì)胞轉(zhuǎn)座最大的挑戰(zhàn)來(lái)自如何進(jìn)行單細(xì)胞插入位點(diǎn)的識(shí)別。
????體細(xì)胞中的轉(zhuǎn)座活動(dòng)和人類的腫瘤有關(guān),某些腫瘤細(xì)胞可能會(huì)形成數(shù)百個(gè)新的轉(zhuǎn)座插入。新轉(zhuǎn)座的插入導(dǎo)致了腫瘤抑制因子的失活,從而促進(jìn)了腫瘤的發(fā)生。
????轉(zhuǎn)座帶來(lái)的其他危害
????轉(zhuǎn)座子的直接危害是其導(dǎo)致的DNA斷裂和插入。但是它并不是唯一(甚至不是最主要)危害宿主的方式。被激活的轉(zhuǎn)座子可以通過(guò)多種方式危害宿主。比如,轉(zhuǎn)座子的去抑制以及其發(fā)生的轉(zhuǎn)錄都可能會(huì)干擾到宿主自身mRNA的正常功能。再比如,轉(zhuǎn)座子編碼的蛋白(內(nèi)切酶)會(huì)導(dǎo)致宿主DNA的斷裂,影響基因組穩(wěn)定。此外,RNA轉(zhuǎn)錄的累積和轉(zhuǎn)座子帶來(lái)的外源DNA序列可能激發(fā)機(jī)體固有免疫反應(yīng),從而導(dǎo)致自身免疫疾病和無(wú)菌性炎癥。
????轉(zhuǎn)座子完成轉(zhuǎn)錄之后,要進(jìn)行翻譯,以及逆轉(zhuǎn)錄(對(duì)于逆轉(zhuǎn)座子),該過(guò)程的發(fā)生會(huì)導(dǎo)致細(xì)胞質(zhì)DNA的形成,以及DNA:RNA雜合序列的存在,這可能會(huì)誘導(dǎo)細(xì)胞炎癥反應(yīng)。
????雖然并不是所有的轉(zhuǎn)座子都編碼蛋白,但是很多轉(zhuǎn)座子的轉(zhuǎn)座過(guò)程會(huì)翻譯出蛋白,比如Gag蛋白,Pol蛋白,Env蛋白。其中Env蛋白具有細(xì)胞毒性,和神經(jīng)元退行性疾病、肌萎縮性側(cè)索硬化癥等有關(guān)。
????轉(zhuǎn)座導(dǎo)致的編碼和非編碼RNA
????轉(zhuǎn)座插入給宿主帶來(lái)的并非只是壞處,轉(zhuǎn)座插入可能會(huì)給一些編碼基因和非編碼RNA的出現(xiàn)提供原始材料,并且發(fā)揮重要的細(xì)胞功能。這一過(guò)程也稱之為轉(zhuǎn)座子的馴化domestication。
????轉(zhuǎn)座子馴化對(duì)細(xì)胞保守功能的形成具有重要作用。某些轉(zhuǎn)座子編碼的基因可能會(huì)被宿主馴化,使轉(zhuǎn)座子失去獨(dú)立轉(zhuǎn)座的能力,成為宿主基因組的一部分。比如在脊椎動(dòng)物免疫系統(tǒng)中,Rag1和Rag2兩個(gè)基因都是來(lái)源于5億年前某個(gè)DNA轉(zhuǎn)座子,其被宿主馴化之后,對(duì)宿主V(D)J體細(xì)胞重組有重要作用,從而促進(jìn)了免疫系統(tǒng)的功能。
????LTR逆轉(zhuǎn)座子的gag基因和env基因以及內(nèi)源性逆轉(zhuǎn)錄病毒(ERVs)也經(jīng)歷了宿主的馴化,對(duì)胎盤發(fā)育、外源逆轉(zhuǎn)錄病毒免疫、大腦發(fā)育等有重要作用。
????多次獨(dú)立對(duì)env基因的馴化,形成了syncytins基因,從而促進(jìn)了胎盤中細(xì)胞的融合和合胞體茲養(yǎng)層的形成。syncytins基因幾乎在所有的哺乳動(dòng)物分支中都有發(fā)現(xiàn),可見轉(zhuǎn)座子對(duì)生物進(jìn)化也是有積極意義的。
????在四足脊椎動(dòng)物祖先中,通過(guò)對(duì)LTR轉(zhuǎn)座子的gag基因馴化,形成了Arc基因, 該基因?qū)τ洃浀男纬珊屯挥|的可塑性有重要意義,它保留了gag基因的大部分功能,比如對(duì)自身RNA的包裝和胞間轉(zhuǎn)運(yùn)。同樣,在果蠅中,也發(fā)現(xiàn)類似的基因,其起源是對(duì)不同支系LTR逆轉(zhuǎn)座子類似gag基因的馴化(類似于脊椎動(dòng)物)。
????上述例子都是轉(zhuǎn)座子將自身基因貢獻(xiàn)給了宿主基因組,有時(shí),轉(zhuǎn)座子可以作為外顯子添加到宿主某些基因中。比如人類中,Alu常常容易被當(dāng)做外顯子而成為某個(gè)基因的一部分。
????研究顯示,L1轉(zhuǎn)座子和人類基因組中成千上萬(wàn)的逆轉(zhuǎn)錄基因有關(guān)。其中很多逆轉(zhuǎn)錄基因仍然具有活性,并發(fā)揮著重要的細(xì)胞功能。有估計(jì),每6000人中就有1人含有一個(gè)新的逆轉(zhuǎn)錄基因。
????轉(zhuǎn)座子還和很多非編碼RNA有關(guān)。包含在IncRNA和mRNA中的轉(zhuǎn)座子序列能直接調(diào)節(jié)其RNA的穩(wěn)定性等功能。
????轉(zhuǎn)座子對(duì)順式調(diào)控元件的作用
????轉(zhuǎn)座子能夠通過(guò)影響順式調(diào)控元件來(lái)影響基因的表達(dá)。比如,通過(guò)影響啟動(dòng)子上游的轉(zhuǎn)座子的甲基化水平,能夠改變小鼠皮毛的顏色。在油棕櫚中,位于一個(gè)控制開花基因中的轉(zhuǎn)座子的甲基化水平,最終決定了該株植物是否產(chǎn)含油量高的果實(shí)。轉(zhuǎn)座序列含有一個(gè)基因調(diào)控網(wǎng)中所需的所有要件。
????TE水平轉(zhuǎn)移
????https://mp.weixin.qq.com/s/XKpEWzT9fIzlx8vUvwgcCg#tocbar-1537coe
????研究轉(zhuǎn)座子需要特殊工具
????長(zhǎng)期以來(lái)人們忽略了對(duì)轉(zhuǎn)座子的研究,即便現(xiàn)在人們對(duì)轉(zhuǎn)座子研究也很具挑戰(zhàn)。特別是轉(zhuǎn)座子高度重復(fù)性的序列,在分析這些轉(zhuǎn)座子時(shí)往往需要特有的一些實(shí)驗(yàn)和分析工具。很多序列靶向工具,比如PCR或者CRISPR-Cas9,需要避免轉(zhuǎn)座子導(dǎo)致的重讀序列,保證靶向序列的唯一性。
????同樣的,這種重復(fù)序列對(duì)基因組比對(duì)也頗具挑戰(zhàn)。不同物種重讀序列比對(duì)難度也有所差異。比如在小鼠中,很多轉(zhuǎn)座子是最新發(fā)生的,對(duì)這些重復(fù)序列的比對(duì)要比對(duì)人的比對(duì)困難。 此外,測(cè)序讀長(zhǎng)的增長(zhǎng),特別是三代長(zhǎng)讀長(zhǎng)測(cè)序,在一定程度上解決了轉(zhuǎn)座子帶來(lái)的重復(fù)序列的比對(duì)。?
????由于其可復(fù)制可移動(dòng)的特點(diǎn),TE在基因組中有時(shí)非常豐富,在有些物種中占到了80%以上(玉米基因組中有85%的TE)。這經(jīng)常給編碼基因的預(yù)測(cè)和注釋帶來(lái)困難,因此通常在進(jìn)行編碼基因預(yù)測(cè)和注釋之前需要將TE進(jìn)行屏蔽。
????作為一種插入性致突變因素,轉(zhuǎn)座子對(duì)宿主基因組既有積極的一面,也有有害的一面。在人類等大多數(shù)物種中(特別是有效群體數(shù)量較小的物種),轉(zhuǎn)座子在遺傳漂變的作用下,大都在群體中固定下來(lái),其對(duì)宿主基因組的影響是近乎中性的。
????轉(zhuǎn)座子在基因組中的分布不是隨機(jī)的。轉(zhuǎn)座的發(fā)生是基因變異的重要誘因,同時(shí)也會(huì)有調(diào)控基因表達(dá)的作用。
? ? 轉(zhuǎn)座子和很多病毒有相似的基因組組成,所以也有假說(shuō)認(rèn)為轉(zhuǎn)座子和某些病毒是有共同祖先的,或者病毒起源于轉(zhuǎn)座子。
聲明:本篇多為資料整理總結(jié),僅用于自學(xué)記錄和交流,侵刪,謝謝。參考:
wo_monic????http://www.itdecent.cn/p/9191633017a1
南之綠桑????http://www.itdecent.cn/p/6273241b26bc
http://www.itdecent.cn/p/8fa4ef437870
https://www.cnblogs.com/pxy7896/p/9882508.html
Bourque, G., Burns, K. H., Gehring, M., Gorbunova, V., Seluanov, A., Hammell, M., ... & Feschotte, C. (2018). Ten things you should know about transposable elements. Genome biology, 19(1), 1-12.
liuhui|劉輝????https://hui-liu.github.io/blog/TE%E5%AF%B9%E5%9F%BA%E5%9B%A0%E7%BB%84%E7%9A%84%E5%BD%B1%E5%93%8D/
AI寫代碼的DNA? ? 義冠? ??https://mp.weixin.qq.com/s/0ka37OAHwvBqx1mWWosjVQ
AI寫代碼的DNA? ? 義冠????https://mp.weixin.qq.com/s/XKpEWzT9fIzlx8vUvwgcCg#tocbar-1537coe
崔勰奎,曹曉風(fēng).高等植物轉(zhuǎn)座元件功能研究進(jìn)展[J].生物化學(xué)與生物物理進(jìn)展,2015,42(11):1033-1046.
碩士論文:LTR類反轉(zhuǎn)錄轉(zhuǎn)座子在棉花中的生物學(xué)功能研究_林靜