Exons,Introns,ORF,CDS,UTR,lncRNA,轉(zhuǎn)錄本,可變剪切,密碼子,啟動子,順式作用元件,轉(zhuǎn)錄起始位點,終止子,轉(zhuǎn)錄因子,結(jié)構(gòu)基因

轉(zhuǎn)自: http://www.itdecent.cn/p/379affdebabe

一.核酸,基因,DNA,染色體,基因組,同源染色體,等位基因

1.核酸,基因,DNA,染色體

核酸:一種通常位于細胞核內(nèi)的大型生物分子,主要負責生物體遺傳信息的攜帶和傳遞。核酸有兩大類,分別是脫氧核糖核酸(DNA)和核糖核酸(RNA)。核酸的單體結(jié)構(gòu)為核苷酸。每一個核苷酸分子由三部分組成:一個五碳糖、一個含氮堿基(A,T,C,G,U)和一個磷酸基。如果五碳糖是脫氧核糖則為脫氧核糖核苷酸,此單體之聚合物是DNA。如果其五碳糖是核糖則為核糖核苷酸,此單體之聚合物是RNA。

基因(gene):是指一段能夠編碼基因產(chǎn)物(RNA或蛋白質(zhì))的核苷酸序列(ATCG)。能編碼出蛋白質(zhì)的是編碼基因,能編碼出RNA的是非編碼基因。弄清其序列本身的過程叫基因測序。基因產(chǎn)物可以是蛋白質(zhì)(蛋白質(zhì)編碼基因)及RNA,從而控制生物個體的性狀(差異)表現(xiàn)。在一個個體當中所有的基因總和叫基因組。在一個物種中所有等位基因的總合叫基因庫。在大多數(shù)真核生物中,基因分為細胞核基因及線粒體基因,綠色植物的葉綠體也含有獨立于細胞核的葉綠體基因組。

在某一細胞類型當中所有被表達的基因叫轉(zhuǎn)錄組,所有編碼蛋白質(zhì)的基因叫蛋白質(zhì)組。

管家基因:在生物體生命的全過程都是必須的,且在一個生物個體的幾乎所有細胞中持續(xù)表達的基因。

C值悖論:物種的基因組大小與遺傳復(fù)雜性并不是線性關(guān)系,與進化的復(fù)雜性也并不一致。

DNA :是一種生物大分子, 由四種脫氧核苷酸分子按照一定數(shù)目和順序組合而成,是一條長鏈分子?;騽t是DNA分子上具有遺傳效應(yīng)的DNA片段(一般來說)。一個DNA分子上有很多個基因。

DNA復(fù)制 :以DNA為模板,在DNA聚合酶的催化作用下,將四種游離的dNTP(ATCG)按照堿基互補配對原則合成新鏈DNA,DNA復(fù)制:模板為雙鏈DNA,合成的新鏈與模板鏈一模一樣,原料為四種dNTP,為半保留復(fù)制。

脫氧核苷酸是DNA的基本組成單位,基因是DNA上有遺傳效應(yīng)的DNA片段,DNA是染色體上的存在物?;蚴侵本€排列在染色體上。

基因是具有遺傳效應(yīng)的DNA片段,存在于DNA上,真核生物的DNA存在于染色體上,基因是構(gòu)成染色體的最小單位,染色體只能存在于真核生物的細胞核中?;虼嬖谟诩毎撕图毎|(zhì)中,也存在于真核生物和原核生物中,真核生物的DNA存在于細胞核、葉綠體和線粒體中。

image

染色質(zhì):由組蛋白和 DNA 組成,147 個堿基對的 DNA 纏繞在 8 個核心組蛋白周圍,形成基本染色質(zhì)單元,即核小體。

染色質(zhì)的功能是將 DNA 高效包裝成小體積,以適合進入細胞的細胞核,保護 DNA 結(jié)構(gòu)和序列。將 DNA 包裝到染色質(zhì)中可確保有絲分裂和減數(shù)分裂,防止染色體斷裂,并控制基因表達和 DNA 復(fù)制。

image

DNA 纏繞在組蛋白周圍,形成核小體;核小體再結(jié)合成染色質(zhì)纖維。1)未包裝的 DNA。2)DNA 纏繞組蛋白八聚體,形成核小體。3)核小體壓縮成染色質(zhì)纖維。

異染色質(zhì)是染色質(zhì)的 緊密排列 形式,可以沉默基因轉(zhuǎn)錄。異染色質(zhì)構(gòu)成 著絲粒、端粒、中心周圍區(qū)域和富含重復(fù)序列的區(qū)域。常染色質(zhì) 凝縮 較少,含有活性最強的轉(zhuǎn)錄基因。可看下圖理解常染色質(zhì)和異染色質(zhì)。

image

** 端粒(Telomere):存在于真核細胞線狀染色體末端的一小段DNA-蛋白質(zhì)復(fù)合體,作用是保持染色體的完整性和控制細胞分裂周期。端粒、著絲粒和復(fù)制原點是染色體保持完整和穩(wěn)定的三大要素。**端粒學(xué)說:處于染色體末端的端粒會隨著細胞的分裂復(fù)制不斷縮短,直至臨界長度,此時細胞失去活性而死亡,因此端粒的縮短意味著細胞的衰老。

著絲粒:又稱中節(jié), 染色質(zhì)的結(jié)構(gòu),將染色體分成分為短臂(p)和長臂(q),主要作用是使復(fù)制的染色體在有絲分裂和減數(shù)分裂中可均等地分配到子細胞中。由高度重復(fù)的異染色質(zhì)組成,其主要成分為DNA和蛋白質(zhì)。

在很多高等真核生物中,著絲??雌饋硐袷窃谌旧w一個點上的濃縮區(qū)域,這個區(qū)域包含著絲點,又稱主縊痕。著絲粒和動粒是存在于主縊痕的兩個特殊結(jié)構(gòu)。中期染色體的兩條姐妹染色單體的連接處,有一向內(nèi)凹陷、著色較淺的縊痕,稱為主縊痕(初級縊痕primary constriction)。

隨體(satellite):位于染色體末端的、圓形或圓柱形的染色體片段, 通過 次縊痕 與染色體主要部分相連,主要由異染色質(zhì)組成,含高度重復(fù)的DNA序列,不具有常染色質(zhì)的功能活性。

image

基因組,同源染色體,等位基因

基因組:細胞或生物體的一套完整單倍體的遺傳物質(zhì)總和。

單倍體:物種的細胞中只有一套染色體的為單倍體。(例:人的精子和未受精的卵子中都只有一套23條染色體,精子細胞和未受精的卵子細胞為單倍體)

雙倍體:物種的細胞中有兩套染色體的為雙倍體。(例:人的體細胞有23對共46條染色體,每23條為一套,人的體細胞為雙倍體)

多倍體:細胞中有n套染色體的為多倍體(n大于或等于3)。

** 同源染色體:**

** 國外教材:真核生物體細胞中成對存在的染色體稱為同源染色體。一對同源染色體上有控制同一性狀的基因,這些基因的排列順序相同,等位基因之間具有相似的序列,所以一對同源染色體彼此具有高度相似的序列,但不一定完全相同。**

國內(nèi)教材:同源染色體在二倍體生物細胞中,形態(tài)、結(jié)構(gòu)基本相同,在減數(shù)第一次分裂的四分體時期中彼此聯(lián)會(若是三倍體及其他奇數(shù)倍體生物細胞,聯(lián)會時會發(fā)生紊亂),在這一對染色體其中的一條來自母方,另一條來自父方。
image
染色體組:一組非同源染色體,攜帶著控制生物體生長,發(fā)育,遺傳和變異的一套信息。

交叉互換:在四分體時期,非姐妹染色單體之間發(fā)生交叉互換,導(dǎo)致基因重組。
image

區(qū)分同源染色體與姐妹染色單體:姐妹染色單體是由一個著絲點連著的兩條染色單體,是在細胞分裂的間期由同一條染色體經(jīng)復(fù)制后形成的,兩條染色單體的DNA序列完全一致。它們形狀大小,DNA序列完全相同(不考慮復(fù)制出差錯),但并非一條來自父方、一條來自母方,所以姐妹染色單體不是同源染色體。同源染色體的兩條單體的DNA序列不相同,并且分別來源于父母體。

**等位基因:****在真核生物中,染色體在體細胞中是成對存在的。每條染色體上都帶有一定數(shù)量的基因。等位基因(allele),是指位于一對同源染色體相同位置上控制同一性狀不同形態(tài)的基因。**等位基因依所攜帶性狀的表現(xiàn),又可**分為顯性基因A和隱性基因a。每個個體分別遺傳自父方和母方的等位基因的不同,兩等位基因 A 和 a 四種組合方式,決定表現(xiàn)出來的性狀也就不同,所以生物與生物之間長得就有一樣之處也有不一樣之處。**

2.轉(zhuǎn)錄,翻譯,mRNA,轉(zhuǎn)錄組,轉(zhuǎn)錄本,可變剪切,最長轉(zhuǎn)錄本,lncRNA

**基因表達:**生物基因組中**結(jié)構(gòu)基因**所攜帶的遺傳信息經(jīng)過轉(zhuǎn)錄、翻譯等一系列過程,合成特定的蛋白質(zhì),進而發(fā)揮其特定生物學(xué)功能和生物學(xué)效應(yīng)的全過程。**說白了基因表達就是轉(zhuǎn)錄,翻譯。**

** 轉(zhuǎn)錄:****遺傳信息從DNA流向RNA的過程。即以雙鏈DNA中的確定的模板鏈(模板鏈用于轉(zhuǎn)錄,編碼鏈不用于轉(zhuǎn)錄)為模板,以A,U,C,G四種核糖核苷酸為原料,在RNA聚合酶催化下合成RNA的過程。合成的新鏈除了把DNA上的T改為U外,其他與編碼鏈一樣。**生成的mRNA攜有的密碼子,進入核糖體后實現(xiàn)蛋白質(zhì)的合成。

轉(zhuǎn)錄僅以DNA的一條鏈作為模板,被選為模板的單鏈稱為模板鏈,亦稱無義鏈;另一條單鏈稱為非模板鏈,即編碼鏈,因編碼鏈與轉(zhuǎn)錄生成的RNA序列T變?yōu)閁外其他序列一致,所以又稱有義鏈。

**翻譯:**以mRNA為模板,在核糖體內(nèi)合成蛋白質(zhì)。原料為20種游離的氨基酸,3個堿基決定一個氨基酸。將成熟的mRNA分子(由DNA通過轉(zhuǎn)錄而生成)中“堿基的排列順序” 解碼,生成對應(yīng)的特定氨基酸序列的過程。**但轉(zhuǎn)錄生成的非編碼RNA,如長鏈非編碼RNA(lncRNA)、轉(zhuǎn)運RNA(tRNA)、核糖體RNA(rRNA)和小核RNA(snRNA)等并不被翻譯為氨基酸序列。**

翻****譯過程需要的原料:mRNA、tRNA、20種氨基酸、能量、酶、核糖體。翻譯的過程大致可分作三個階段:起始、延長、終止。

翻譯主要在細胞質(zhì)內(nèi)的核糖體中進行,氨基酸分子在氨基酰-tRNA合成酶的催化作用下與特定的轉(zhuǎn)運RNA(tRNA)結(jié)合并被帶到核糖體上。生成的多肽鏈(即氨基酸鏈)需要通過正確折疊形成蛋白質(zhì),許多蛋白質(zhì)在翻譯結(jié)束后還需要在內(nèi)質(zhì)網(wǎng)上進行翻譯后修飾才能具有真正的生物學(xué)活性。

** mRNA:messengerRNA,信使RNA是由DNA經(jīng)hnRNA剪接而成,攜帶遺傳信息的能指導(dǎo)蛋白合成的一類單鏈核糖核酸。**

**反義RNA:堿基序列正好與有意義的 mRNA 互補的 RNA。** 

**轉(zhuǎn)錄組:一般是指從細胞或組織的基因組所轉(zhuǎn)錄出來的RNA的總和,包括編碼蛋白質(zhì)的mRNA和各種非編碼RNA**    **(rRNA,tRNA,snRNA,snoRNA,lncRNA,microRNA等)**

**轉(zhuǎn)錄本:**是指由一條基因通過**轉(zhuǎn)錄,由于可變剪切**形成的一種或多種可供編碼蛋白質(zhì)的成熟mRNA(狹義)

非編碼RNA(Non-coding RNA)如lncRNA也有轉(zhuǎn)錄本的說法
**可變剪切(Alternative splicing):一條未經(jīng)剪接的前體hnRNA,要將非編碼蛋白質(zhì)的內(nèi)含子(intron)切除,同一基因中的很多個外顯子以不同形式進行隨機組合(在剪切的過程中是有可能剪切掉一些外顯子的),使一個基因在不同時間、不同環(huán)境中能夠制造出不同的蛋白質(zhì),增加生理狀況下系統(tǒng)的復(fù)雜性或適應(yīng)性。這個過程有多種多樣的剪切和拼接方式(選擇不同的剪接位點),從而產(chǎn)生不同的剪切異構(gòu)體(isoform)。**

**最長轉(zhuǎn)錄本:由于可變剪切一個基因得到好多個序列長度不同的轉(zhuǎn)錄本,應(yīng)該挑選出序列最長的最長轉(zhuǎn)錄本作為數(shù)據(jù)的分析**

**lncRNA:和mRNA一樣,是由對應(yīng)的基因轉(zhuǎn)錄而成,通過剪接形成成熟體的lncRNA,具有5'帽子和poly尾巴(有些會沒有)。同一基因可以形成不同的轉(zhuǎn)錄本的lncRNA。在lncRNA所對應(yīng)的的DNA序列上,包含內(nèi)含子和外顯子,轉(zhuǎn)錄之后的轉(zhuǎn)錄本,經(jīng)過剪接等作用,外顯子,內(nèi)含子拼接到一起成為一個成熟的lncRNA(lncRNA對應(yīng)的轉(zhuǎn)錄本剪切會保留內(nèi)含子)。但是它因為缺乏可識別的閱讀框,所以不表達蛋白。**
image

3.外顯子,內(nèi)含子

**基因DNA分為編碼區(qū)和非編碼區(qū),編碼區(qū)包含外顯子和內(nèi)含子,非編碼區(qū)包括前導(dǎo)區(qū)(5‘UTR)、尾部區(qū)(3‘UTR)、調(diào)控區(qū),調(diào)控區(qū)又包括啟動子、增強子、終止子等。真核生物非編碼區(qū)位于編碼區(qū)的上游和下游,故又稱側(cè)翼序列。編碼區(qū)則轉(zhuǎn)錄為mRNA并最終翻譯成蛋白質(zhì)。真核生物的基因含有外顯子和內(nèi)含子,是前者區(qū)別原核生物的特征之一。**

**基因轉(zhuǎn)錄之后,首先是形成前體mRNA(或pre-mRNA),通過剪切內(nèi)含子連接外顯子,5’端加帽及3’端加尾之后形成成熟的mRNA。**真正編碼蛋白質(zhì)的是外顯子,內(nèi)含子無編碼功能。**內(nèi)含子存在于DNA中,在轉(zhuǎn)錄的過程中,DNA上的內(nèi)含子也會被轉(zhuǎn)錄到前體RNA中,但前體RNA上的內(nèi)含子會在RNA離開細胞核進行翻譯前被切除。**

**內(nèi)含子和外顯子的概念都是針對DNA序列而不是RNA序列的。****內(nèi)含子和外顯子的分界線在于:GU-AG法則。即每個內(nèi)含子的開始兩個堿基都是GU(或GT),最后兩個是AG。**

基因經(jīng)過轉(zhuǎn)錄形成Pre mRNA,這里面包含著內(nèi)含子和外顯子**(5端是以外顯子打頭,但是這段外顯子不僅包含CDS,還包含5' UTR;3端是以外顯子結(jié)束,但是這段外顯子不僅包含CDS,還包含3' UTR)**,經(jīng)過剪接形成成熟mRNA,內(nèi)含子已減掉,**如果拋開后來加上去的cap和poly A的話,這時全是外顯子,但是不全是CDS,因為只有中間的那部分以起始密碼子AUG開始、以終止密碼子結(jié)束的片段才是CDS,只有這部分才會被翻譯成蛋白質(zhì)。**

外顯子拼接形成成熟的mRNA,mRNA的長度要大于CDS,只有CDS才編碼蛋白,即 外顯子不一定都能翻譯成蛋白: mRNA包括UTR和CDS

外顯子與CDS區(qū)不是完全一致的,cds區(qū)一定屬于外顯子,但是外顯子不一定是CDS區(qū),可能還包括UTR

**一個外顯子經(jīng)常編碼蛋白的一個蛋白質(zhì)結(jié)構(gòu)域。蛋白質(zhì)結(jié)構(gòu)域(protein domain)是蛋白質(zhì)中的一類結(jié)構(gòu)單元,是構(gòu)成蛋白質(zhì)(三級)結(jié)構(gòu)的基本單元。**

4.****ORF,CDS,起始密碼子,終止密碼子

**CDS Sequence :**蛋白質(zhì)編碼區(qū) coding for amino acids in protein ,是編碼一段蛋白產(chǎn)物的序列,是結(jié)構(gòu)基因組學(xué)術(shù)語。**它就是與蛋白序列一一對應(yīng)的DNA序列,并且序列中間不存在其他與蛋白無關(guān)的序列,即:**

**CDS沒有任何內(nèi)含子,5‘UTR,3‘UTR**

**ORF 開放閱讀框:Open Reading Frame。**是從一個起始密碼子開始到一個終止密碼子結(jié)束的一段序列,它是**理論上的蛋白編碼區(qū)**,一般是先在DNA序列中尋找起始密碼子(AUG)對應(yīng)的序列ATG,然后按每3個堿基一組(密碼子以三個堿基為一單位)向后延伸,一直到出現(xiàn)終止密碼子(UAG、UGA、UAA)對應(yīng)的序列。

由于密碼子讀寫起始位點的不同,mRNA序列可能按六種ORF閱讀和翻譯(每條鏈三種,對應(yīng)三種不同的起始位點)。在6種潛在ORF中,一般選擇中間沒有被終止密碼子隔開的最大的閱讀框為正確結(jié)果。(可能不好懂,[舉個例子](http://www.itdecent.cn/p/2ba85c5306e7))

**CDS與開放閱讀框ORF的區(qū)別**:CDS可以是開放閱讀框(ORF)的子集。

負責翻譯的DNA區(qū)域合起來就是ORF序列,而轉(zhuǎn)錄本逆轉(zhuǎn)錄就是cDNA序列

密碼子(codon)是指 mRNA 分子中每相鄰的三個核苷酸編成一組,在蛋白質(zhì)合成時,代表某一種氨基酸的規(guī)律。

信使RNA在細胞中能決定蛋白質(zhì)分子中的氨基酸種類和排列次序。mRNA分子中的四種核苷酸(堿基)的序列(AUCG)能決定蛋白質(zhì)分子中的20種氨基酸的序列。而在信使RNA分子上的三個堿基能決定一個氨基酸。

密碼子的簡并性:分子生物學(xué)中,同一種氨基酸具有兩個或更多個密碼子的現(xiàn)象稱為密碼子的簡并性(degeneracy)。**對應(yīng)于同一種氨基酸的不同密碼子稱為同義密碼子(synonymous codon),只有色氨酸與甲硫氨酸僅有1個密碼子。**
**起始密碼子和終止密碼子**都是**mRNA上的**三聯(lián)體堿基序列,分別決定翻譯的起始和終止。

**起始密碼子 start codon:**指定 mRNA 上開始合成蛋白質(zhì)的密碼子,也是第一個被核糖體翻譯的mRNA上的密碼子,位于編碼區(qū)內(nèi),緊鄰5′UTR。較為常見的起始密碼子是**AUG。**

**起始密碼子 start codon 和起始子 Initiator 不是一個概念。真核生物中蛋白質(zhì)編碼基因的核心啟動子元件有4類:傳統(tǒng)的TATA盒、上游核心啟動子元件BRE、下游啟動子元件DPE和起始子(initiator,Inr)。Initiator元件指的是一段富含嘧啶的序列——PyPyA+1NT/ApyPy,轉(zhuǎn)錄起始位點位于其中的+1位。**

**終止密碼子 stop codon:**終止肽鏈合成的信使核糖核酸(mRNA)的三聯(lián)體堿基序列,**UAA、UAG和UGA**,它們不編碼氨基酸。
image

5.UTR

**UTR   **Untranslated Regions **非翻譯區(qū),代表Exon的非蛋白質(zhì)編碼部分,**是 **mRNA 分子兩端的非蛋白編碼片段**

5'-UTR**從mRNA起點的 甲基化鳥嘌呤核苷酸帽 延伸至 AUG起始密碼子**

3'-UTR**從編碼區(qū)末端的 終止密碼子 延伸至 多聚A尾巴(Poly-A)的前端**

下圖為DNA直接轉(zhuǎn)錄產(chǎn)物(hnRNA)不含非編碼區(qū)含有內(nèi)含子

image
image
image

6. 基因組學(xué)文件說明,從基因組注釋文件整理出基因蛋白編碼區(qū)、起始密碼子上游幾KB和內(nèi)含子信息gff3文件

**genome.fasta    即基因組每條染色體/scanffold/contig的DNA序列(ATCG)**

** final.gene.longest.gff3 基因組 gff 注釋文件 一般基因的位置信息與mRNA位置信息相同,就只包括了5‘UTR到3‘UTR之間的區(qū)域(即只包括編碼區(qū)不包括非編碼區(qū)),注釋文件中也可能會有一些基因 5‘UTR,3‘UTR區(qū)域鑒定不出來沒有細寫**

** final.gene.longest.gff3.transcript.fa 即最長轉(zhuǎn)錄本每條轉(zhuǎn)錄本對應(yīng)的每個基因的核苷酸序列 (ATCG)**

final.gene.longest.gff3.cds.fa 即最長轉(zhuǎn)錄本每條轉(zhuǎn)錄本對應(yīng)的編碼蛋白質(zhì)的核苷酸序列(ATCG)

** final.gene.longest.gff3.pep.fa 即最長轉(zhuǎn)錄本每條轉(zhuǎn)錄本的CDS序列翻譯出來的蛋白序列(氨基酸序列)(CLESRKVFVG等)**

**[用python從基因組注釋文件(gff3格式)整理出基因蛋白編碼區(qū)、起始密碼子上游幾KB和內(nèi)含子信息的gff3文件](https://links.jianshu.com/go?to=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FFs0wogah7G9u-lCZeo4tdw)(這里的起始密碼子上游幾KB尋找代碼用要注意,作者注釋文件中mRNA的起始位置和第一個CDS起始位置一致,即無5‘UTR信息)** 

7.****非編碼區(qū),調(diào)控區(qū),啟動子,終止子,回文序列

**非編碼區(qū)(Non-coding region)是不能夠轉(zhuǎn)錄為相應(yīng)信使RNA,不能指導(dǎo)蛋白質(zhì)合成(也就是不能編碼蛋白質(zhì))的區(qū)段。非編碼區(qū)位于編碼區(qū)前后,同屬于一個基因,控制基因的表達和強弱。真核生物非編碼區(qū)位于編碼區(qū)的上游和下游,故又稱側(cè)翼序列。** 

側(cè)翼序列(非編碼區(qū))包括前導(dǎo)區(qū)(5‘UTR)、尾部區(qū)(3‘UTR)、調(diào)控區(qū)。側(cè)翼序列(非編碼區(qū))雖然不能編碼蛋白質(zhì),但一般非編碼區(qū)具有調(diào)控基因表達的功能。

調(diào)控區(qū)又稱調(diào)控序列。調(diào)控序列(Regulatory sequence)可以是DNA中一段包含啟動子、終止子、增強子、沉默子,以及一些調(diào)節(jié)蛋白(如轉(zhuǎn)錄因子)附著位點的核酸片段。這些序列調(diào)控了基因的表達,進而影響蛋白質(zhì)的合成,調(diào)節(jié)轉(zhuǎn)錄的水平。

順式作用元件(cis-regulatory elements):CREs, 能影響基因表達,但不編碼RNA和蛋白質(zhì)的DNA序列。

按功能特性,真核基因順式作用元件分為啟動子、增強子及沉默子。

反式作用因子:能識別和結(jié)合特定的順式作用元件,并影響基因轉(zhuǎn)錄的一類蛋白質(zhì)或RNA。

啟動子:promoter,指一段能使特定基因進行轉(zhuǎn)錄的DNA序列。啟動子可以被RNA聚合酶辨認,并開始轉(zhuǎn)錄合成RNA。一般啟動子位于5‘UTR上游(編碼區(qū)上游),緊靠著轉(zhuǎn)錄起點,引導(dǎo)RNA聚合酶與基因的正確部位結(jié)合,其本身不被轉(zhuǎn)錄,長約100~1000堿基對(nt)。有一些啟動子 (如tRNA啟動子) 位于轉(zhuǎn)錄起始點的下游,這些DNA序列可以被轉(zhuǎn)錄。

增強子:enhancer,與反式作用因子結(jié)合,增強轉(zhuǎn)錄活性,在基因任意位置都有效,無方向性,遠離轉(zhuǎn)錄起始位點,可位于轉(zhuǎn)錄起始點的上游或下游。從功能上講,沒有增強子存在,啟動子通常不能表現(xiàn)活性;沒有啟動子時,增強子也無法發(fā)揮作用。根據(jù)南京大學(xué)陳迪俊老師的研究表明增強子比啟動子能結(jié)合更多的轉(zhuǎn)錄因子[(Nature Communications)](https://links.jianshu.com/go?to=https%3A%2F%2Fwww.nature.com%2Farticles%2Fs41467-019-09513-2)

沉默子:silencer,基因表達負調(diào)控元件,與反式作用因子結(jié)合,抑制轉(zhuǎn)錄活性。
**如下圖,可以看到不同的調(diào)控序列:** 
image

轉(zhuǎn)錄起始位點與啟動子:

** 1.轉(zhuǎn)錄起始位點(transcription start site,TSS )是指一個基因的5'端轉(zhuǎn)錄的第一個堿基(是指 5'UTR 頭的第一個堿基,不是尾),它是與新生RNA鏈第一個核苷酸相對應(yīng)DNA鏈上的堿基,通常為一個嘌呤(A或G)。在一個典型的基因內(nèi)部,排列順序為轉(zhuǎn)錄起始位點(TSS,一個堿基)-起始密碼子編碼序列 (ATG)-終止密碼子編碼序列-轉(zhuǎn)錄終止位點 (TTS),即TSS-ATG-TGA-TTS**

** 通常把轉(zhuǎn)錄起始位點前即 5'末端(5'UTR 頭的末端,不是尾)的序列稱為上游,而把其后即 3'末端(3'UTR 尾的末端) 的序列稱為下游。**

**2.啟動子(promoter):是指一段能使特定基因進行轉(zhuǎn)錄的DNA序列。啟動子可以被RNA聚合酶辨認,并開始轉(zhuǎn)錄合成RNA。**在RNA合成中,啟動子可以和調(diào)控基因轉(zhuǎn)錄的轉(zhuǎn)錄因子產(chǎn)生相互作用,控制基因表達(轉(zhuǎn)錄)的起始時間和表達的程度,包含核心啟動子區(qū)域和調(diào)控區(qū)域,就像“開關(guān)”,決定基因的活動,繼而控制細胞開始生產(chǎn)哪一種蛋白質(zhì)。其核心部分是非編碼區(qū)上游的RNA聚合酶結(jié)合位點,指揮聚合酶的合成,這種酶指導(dǎo)RNA的復(fù)制合成。

**一般啟動子位于5‘UTR上游(編碼區(qū)上游),緊靠著轉(zhuǎn)錄起點,引導(dǎo)RNA聚合酶與基因的正確部位結(jié)合,其本身不被轉(zhuǎn)錄,長約100~1000堿基對(nt)。**有一些啟動子 (如tRNA啟動子) 位于轉(zhuǎn)錄起始點的下游,這些DNA序列可以被轉(zhuǎn)錄。

**強啟動子**(strong promoter):對RNA聚合酶有很高親和力的啟動子,可以指導(dǎo)合成大量的mRNA。

真核生物體內(nèi)具有三種保守的RNA聚合酶(Pol I,II,和III),它們可以將核基因組轉(zhuǎn)錄成各種編碼和非編碼轉(zhuǎn)錄本(植物還使用另外兩種酶,Pol IV和Pol V來產(chǎn)生非編碼轉(zhuǎn)錄本如lncRNA)。Pol I,II,和III 三類聚合酶能夠識別不同的啟動子,即**啟動子有三類。其中II類啟動子**由**:**傳統(tǒng)的TATA盒、上游核心啟動子元件BRE、下游啟動子元件DPE 和 起始子(initiator,Inr) 四部分組成,轉(zhuǎn)錄起始位點位于起始子內(nèi)**。**

3.啟動子是一段序列,轉(zhuǎn)錄起始位點是一個堿基。不能相等同。RNA聚合酶II(pol II)所識別的啟動子(II類啟動子)包含轉(zhuǎn)錄起始位點,兩者屬包含與被包含的關(guān)系。

**終止子 terminator :位于編碼區(qū)下游,是轉(zhuǎn)錄過程中能夠終止RNA聚合酶轉(zhuǎn)錄的DNA序列。緊靠著轉(zhuǎn)錄的終點位置,**阻礙RNA聚合酶的移動,并使其從DNA模板鏈上脫離下來。終止子可分為兩類:一類不依賴于蛋白質(zhì)輔因子就能實現(xiàn)終止作用。另一類則依賴蛋白輔因子才能實現(xiàn)終止作用。

**基因非編碼區(qū)的堿基的插入、缺失和替代也屬于基因突變事件,盡管大多數(shù)的研究是局限在編碼區(qū)突變。** 

**回文序列:**是一段長約7-20個核苷酸對的反向重復(fù)順序,**也稱為終止信號,是RNA聚合酶轉(zhuǎn)錄終止的信號,位于AATAAA的下游**,其對稱軸距轉(zhuǎn)錄終止點約16-24bp。**因為回文序列的特殊排列,其大多都位于非編碼區(qū)。**

8.轉(zhuǎn)錄因子及結(jié)合位點,結(jié)構(gòu)基因,調(diào)節(jié)基因,操縱基因

**轉(zhuǎn)錄因子(transcription factor):**一群能與基因**5'端上游特定序列專一性結(jié)合**,從而保證目的基因以**特定的強度**在特定的**時間與空間**表達的蛋白質(zhì)分子,這些蛋白質(zhì)能調(diào)控其基因的轉(zhuǎn)錄。調(diào)控方法是轉(zhuǎn)錄因子可以調(diào)控核糖核酸聚合酶(RNA聚合酶,或叫RNA合成酶)與DNA模板的結(jié)合。** 更詳細的轉(zhuǎn)錄因子介紹:[https://cloud.tencent.com/developer/article/1376739](https://links.jianshu.com/go?to=https%3A%2F%2Fcloud.tencent.com%2Fdeveloper%2Farticle%2F1376739)**

轉(zhuǎn)錄因子與RNA聚合酶Ⅱ形成轉(zhuǎn)錄起始復(fù)合體,共同參與轉(zhuǎn)錄起始的過程。

**TF結(jié)合位點 transcription factor binding site,TFBS:**轉(zhuǎn)錄因子調(diào)節(jié)基因表達時,與基因模板鏈結(jié)合的區(qū)域。**一般應(yīng)該分布在基因前端(但:人21和22號染色體上,只有22%的轉(zhuǎn)錄因子結(jié)合位點分布在蛋白編碼基因的5'端)**

**三種基因是對基因的功能所作的區(qū)分,是以直線形式排列在染色體上:** 

結(jié)構(gòu)基因:是決定合成某一種蛋白質(zhì)或RNA分子結(jié)構(gòu)相應(yīng)的一段DNA。結(jié)構(gòu)基因的功能是把攜帶的遺傳信息轉(zhuǎn)錄給mRNA(信使核糖核酸),再以mRNA為模板合成具有特定氨基酸序列的蛋白質(zhì)或RNA。

1)原核生物結(jié)構(gòu)基因:連續(xù)的,RNA合成不需要剪接加工;

2)真核生物結(jié)構(gòu)基因:由外顯子(編碼序列) 和內(nèi)含子(非編碼序列) 兩部分組成。

非結(jié)構(gòu)基因:結(jié)構(gòu)基因兩側(cè)的一段不編碼的DNA片段(即側(cè)翼序列),參與基因表達調(diào)控。

**調(diào)節(jié)基因:是調(diào)節(jié)蛋白質(zhì)合成的基因 。它能使結(jié)構(gòu)基因在需要某種酶時就合成某種酶,不需要時,則停止合成**,它對不同染色體上的結(jié)構(gòu)基因有調(diào)節(jié)作用。

**操縱基因:位于結(jié)構(gòu)基因的一端,是操縱結(jié)構(gòu)基因的基因。當操縱基因“開動”時,處于同一染色體上的,由它所控制的結(jié)構(gòu)基因就開始轉(zhuǎn)錄、翻譯和合成蛋白質(zhì)。當“關(guān)閉”時,結(jié)構(gòu)基因就停止轉(zhuǎn)錄與翻譯。**操縱基因與一系列受它操縱的結(jié)構(gòu)基因合起來就形成一個**操縱子**。

在正常情況下,在需要某種或其有關(guān)的酶時,**在調(diào)節(jié)基因和操縱基因的控制下等候在啟動子 (Promotor) 位置上的RNA聚合酶開始轉(zhuǎn)錄,從而產(chǎn)生了與這些酶有關(guān)的結(jié)構(gòu)基因的信使RNA,并由后者合成所需的酶。**若結(jié)構(gòu)基因發(fā)生突變,便會產(chǎn)生失去活性的蛋白質(zhì),從而造成差錯。

聲明:本篇多為資料整理總結(jié),僅用于自學(xué)記錄和交流,侵刪,謝謝。參考:

素錦時年_1b00 http://www.itdecent.cn/p/df37d5f56bca

米妮愛分享 http://www.itdecent.cn/p/65e2c2ad19a6

劉小澤 http://www.itdecent.cn/p/2ba85c5306e7

Han_zh http://www.itdecent.cn/p/91241c82ba5e

LeoinUSA http://www.itdecent.cn/p/a56ba94eaf36

劉小澤 https://www.jieandze1314.com/post/cnposts/169/

叩響生信之門 https://mp.weixin.qq.com/s/Fs0wogah7G9u-lCZeo4tdw

https://www.abcam.cn/epigenetics/chromatin-structure-and-function-a-guide-2

轉(zhuǎn)錄起始位點與啟動子

Sc_RNA_seq http://www.itdecent.cn/p/a2c0d5b0dbc1

https://zhuanlan.zhihu.com/p/63596994 端粒

作者:ytbao
鏈接:http://www.itdecent.cn/p/379affdebabe
來源:簡書
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請注明出處。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容