補(bǔ)充-1:基因是什么?

在演化故事的敘述中,基因一直是故事的核心。而基因想法的提出、驗(yàn)證,到最終的實(shí)物上的對(duì)應(yīng),功能的明確,卻經(jīng)歷了漫長而曲折的過程。本次借著復(fù)習(xí)植物學(xué)的機(jī)會(huì),我們來學(xué)習(xí)一下生物遺傳的最基本特征,進(jìn)而加深我們對(duì)演化的主力——基因,有更好地理解。

基因是什么?實(shí)際上這個(gè)問題的答案非常復(fù)雜,因?yàn)椴煌膶用嬗胁煌卮?。從物質(zhì)本質(zhì)上來說,基因是一段特殊的DNA;從功能上來看,基因給生物的一切內(nèi)容創(chuàng)造了基礎(chǔ)(在此之上環(huán)境再和基因相互作用改);從演化來說,基因是演化的最小的單位。遵著唯物主義的精神,我們先認(rèn)識(shí)一下基因的實(shí)體,也就是DNA。

DNA,全稱是脫氧核糖核酸(deoxyribonucleic acid)。我們都聽說過DNA是個(gè)雙螺旋double helix結(jié)構(gòu),像螺旋樓梯,那么這個(gè)雙螺旋“樓梯”的“臺(tái)階”是什么呢?組成這個(gè)雙螺旋臺(tái)階的單元是一個(gè)個(gè)核苷酸。DNA是一種多聚物polymer,這是一個(gè)化學(xué)上的概念,指該物質(zhì)由很多個(gè)小的單體monomer重復(fù)很多很多很多個(gè),以特殊的方式聚合成一個(gè)高分子物質(zhì)。DNA的單體非常簡單,就是核苷酸nucleotides,而每個(gè)小核苷酸又是3個(gè)小組分化合起來的一個(gè)化合物,包括一個(gè)含有N元素的堿基base,一個(gè)5碳為骨架的糖分子,即脫氧核糖deoxyribose,和一個(gè)磷酸基團(tuán)phosphate group。因?yàn)镈NA的單體所使用的糖分子是脫氧的,這和之后講到的DNA的親戚RNA所用的糖不同(RNA的糖有氧),所用DNA的單體叫脫氧核糖核酸deoxyribonucleotide。脫氧核糖核苷酸的三個(gè)組分中,磷酸基團(tuán)和脫氧核糖都是不變的,所有的單體都有著一樣的成分,但是堿基則有四種不同的類型,就是我們耳熟能詳?shù)腁GTC:其中兩個(gè)是嘌呤類物質(zhì)purine,adenine腺嘌呤A,guanine鳥嘌呤G;兩個(gè)是嘧啶類pyrimidine,thymine 胸腺嘧啶T,cytosine胞嘧啶C (圖1)。

圖1

小單體之間通過磷酸二酯鍵phosphodiester bond(圖中這里的磷酸-糖鍵是俗稱,為了簡化)相互連接,就構(gòu)成了DNA雙螺旋的一條鏈。而堿基是DNA螺旋結(jié)構(gòu)的關(guān)鍵。堿基之間可以通過一種特殊的分子間作用力(即氫鍵hydrogen bond)相互配對(duì),配對(duì)的原則是A-T,C-G,即嘧啶和嘌呤相互結(jié)合。堿基相互配對(duì)識(shí)別朝向內(nèi)側(cè),各自把自己的磷酸-五碳糖部分撅向外側(cè),這樣一個(gè)單鏈的脫氧核糖核酸多聚體就可以和相應(yīng)的互補(bǔ)的鏈配對(duì)變成一個(gè)雙鏈。在自身和外界聯(lián)合的復(fù)雜分子間作用力下,雙鏈DNA會(huì)自發(fā)地扭曲成雙螺旋的結(jié)構(gòu),這就是我們熟知的樣子了(圖2)。

圖2:左側(cè)是DNA雙螺旋,外圍紫色的是磷酸-五碳糖組成的“扶手”,中間的“臺(tái)階”是相互互補(bǔ)配對(duì)的堿基對(duì)。配對(duì)的過程是右圖。

因?yàn)镈NA中堿基的類型只有4種,可以理解為基因的“語言”中只有4種文字(注意,將基因類比成語言、文字、書籍、信息的一類比喻會(huì)在整個(gè)講解中反復(fù)使用,因?yàn)檫@是我目前遇見的最適合的類比體系了,并且兩個(gè)體系本質(zhì)上確實(shí)是一樣的事情)。這么少的文字類型,想要傳達(dá)復(fù)雜的信息,顯然我們說的“話”就要非常非常長才足夠說出我們想要的信息。如果學(xué)習(xí)過進(jìn)制轉(zhuǎn)化,你一定記得在十進(jìn)制下一個(gè)單個(gè)數(shù)字的數(shù)值被轉(zhuǎn)化成二進(jìn)制之后增多了多少個(gè)數(shù)字。DNA這里也是如此,為了儲(chǔ)存大量的信息,每一種生物的DNA都長得夸張:平均的一個(gè)細(xì)胞中所有DNA的長度會(huì)長達(dá)5cm。而真核生物細(xì)胞的平均大小也才幾十微米μm(1cm=10000μm)。這樣長的DNA鏈必須要有序地存放在細(xì)胞里面,才能方便讀取、復(fù)制。因此生物采用了一套非常高效的多級(jí)壓縮的機(jī)制,將DNA長鏈緊密地壓縮到大概只有10微米,整整縮小了5000倍。

整個(gè)壓縮的體系是多層嵌套的。DNA雙鏈?zhǔn)紫葧?huì)一小段一小段地纏繞在一種球形蛋白:組蛋白histone上,形成一種串珠狀的結(jié)構(gòu),這每一個(gè)小的組蛋白-DNA串珠稱之為核小體nucleosome。一串核小體再圍繞著一些蛋白結(jié)構(gòu)開始進(jìn)一步壓縮螺旋,最終會(huì)壓縮成緊密的長條,這就像是一根根細(xì)絲縮成了毛線。這個(gè)包含了組蛋白和DNA的壓縮的結(jié)構(gòu),我們稱之為染色質(zhì)chromatin。很多的染色質(zhì)在細(xì)胞核中呈現(xiàn)比較自由的狀態(tài),像是一坨散亂的毛線,而在特殊的細(xì)胞分裂時(shí)期,為了讓染色質(zhì)均等地分配給兩個(gè)子代細(xì)胞,這些染色質(zhì)還可以進(jìn)一步壓縮成棒狀,也就是染色體chromosome。這個(gè)過程類似于把毛線團(tuán)成毛線團(tuán)。一個(gè)一個(gè)規(guī)整的染色體就能很方便被細(xì)胞分配給自帶細(xì)胞。這樣一層一層的多級(jí)折疊壓縮的結(jié)構(gòu),就是一個(gè)細(xì)胞的細(xì)胞核中DNA的日常樣子(圖3)?;虻膶?shí)體DNA平時(shí)就以染色質(zhì)的形式在細(xì)胞中壓縮儲(chǔ)存,這對(duì)于基因的表達(dá)有著至關(guān)重要的作用,就像書的實(shí)體形態(tài)會(huì)影響我們?cè)趺礃訌臅蝎@取信息一樣:電子書和紙質(zhì)書的閱讀體驗(yàn)不一樣,而閱讀一本被“膠封”的書和一本活頁書感覺又完全不同。這其中的細(xì)節(jié)我們會(huì)在之后的基因的表達(dá)中詳細(xì)講解。

圖3. https://zh.wikipedia.org/wiki/%E6%9F%93%E8%89%B2%E4%BD%93

認(rèn)識(shí)過基因的外觀實(shí)體結(jié)構(gòu)之后,我們要看一看基因的內(nèi)部結(jié)構(gòu)是什么樣的,也就是,DNA上的序列長什么樣子。生物體的一切基底信息都蘊(yùn)藏在基因中,基因就像是一本生物的藍(lán)圖。而藍(lán)圖構(gòu)建出具體實(shí)物的核心途徑是指導(dǎo)生物大廈中重要的組建:蛋白質(zhì)的合成。因此,常見的對(duì)基因的定義就是,能指導(dǎo)合成一個(gè)蛋白質(zhì)的一段DNA序列,就是基因。我們這里先粗顯地認(rèn)為,基因的定義是能表達(dá)出蛋白質(zhì)的一段DNA,這是最古老的也最典型的視角,盡管可能有一定的偏差,但是并不妨礙我們對(duì)真實(shí)世界的認(rèn)識(shí)。接下來要說的內(nèi)容,是關(guān)注于真核生物eukaryota的基因結(jié)構(gòu),原核生物prokaryote的基因結(jié)構(gòu)會(huì)有一些變動(dòng),不過大致的框架其實(shí)是相似的。

如果你還記得高中生物的中心法則central dogma,你就可能還對(duì)DNA——RNA——蛋白質(zhì)這條表達(dá)的路徑有過印象。不過不記得也無妨,在詳細(xì)介紹中心法則之前,我們可以先看看這個(gè)中心法則是在一個(gè)什么樣的結(jié)構(gòu)上起步的。既然說過基因是一段能表達(dá)的DNA,那么很顯然,這段DNA序列中要有一段是最終翻譯成蛋白質(zhì)的。沒錯(cuò),這樣重要的區(qū)段,我們將其稱為編碼區(qū)coding region,是一個(gè)基因中的核心部分。這一部分的堿基三個(gè)三個(gè)一組對(duì)應(yīng)到轉(zhuǎn)錄出的mRNA上就是一串密碼子,會(huì)被核糖體識(shí)別翻譯出蛋白質(zhì),接著蛋白質(zhì)就開始執(zhí)行生物的一切功能。我們可以把這段編碼區(qū)DNA所帶有的信息想象成是一本故事集中的一個(gè)故事主體,這就是我們讀故事的重要內(nèi)容,沒錯(cuò)吧?你總是想要讀一個(gè)故事,而不是說看了點(diǎn)腳注標(biāo)題目錄就敢說自己看了一個(gè)故事(好像也有人這么做呢)。

不過在翻開一本故事集時(shí),你要怎么樣才能知道你想要讀的故事開始了呢?也許你一頁一頁地翻,直到看到了你想要讀的故事的標(biāo)題,這時(shí)候你就知道,一個(gè)正常排版的書中接下來書的內(nèi)容就要是這個(gè)故事了。對(duì)于DNA,情況是完全一樣的,細(xì)胞需要知道一段編碼區(qū)從什么地方起始,才能決定要不要開始表達(dá)這個(gè)基因。類似書中的標(biāo)題,DNA上在緊挨著編碼區(qū)的前方有一個(gè)特殊的序列,叫啟動(dòng)子promoter。這個(gè)啟動(dòng)子是轉(zhuǎn)錄過程中起始轉(zhuǎn)錄的蛋白質(zhì)(RNA聚合酶RNA polymerase)識(shí)別的地方。起始轉(zhuǎn)錄的蛋白沿著DNA序列前進(jìn)時(shí),一旦讀到這段啟動(dòng)子序列,它就明白自己馬上就要開始干活了,這時(shí)它就可以精神抖擻地調(diào)整好自己開始勇往直前轉(zhuǎn)錄接下來的編碼區(qū)了(這里用了擬人的手法表述這個(gè)過程,實(shí)際上后面了解到基因表達(dá)的調(diào)控時(shí),會(huì)知道這里的過程有偏差;并且真實(shí)的生物體中RNA聚合酶是不會(huì)“有意識(shí)地主動(dòng)地去讀DNA”,而是隨機(jī)地碰撞到這里后,因?yàn)閱?dòng)子序列對(duì)RNA聚合酶有更高的親和性,所以酶暫時(shí)跑不開,就開始轉(zhuǎn)錄了)。

現(xiàn)在我們繼續(xù)想象那個(gè)讀書的類比,剛剛我們把書翻了好久才看到標(biāo)題而找到自己想讀的故事。這種傻得冒泡的事情我們一般不會(huì)做。常見的是,我們會(huì)先去看書的目錄,找到我們的故事對(duì)應(yīng)的頁碼,然后再開始翻到對(duì)應(yīng)頁數(shù),看到了期待的標(biāo)題,確定這是我們要的故事。對(duì)于一個(gè)有目錄的書,這樣的閱讀方式明顯高效許多。那么在DNA上,確實(shí)也有很多序列類似于書的目錄,它們一般分布在編碼區(qū)的前方,指導(dǎo)著開始轉(zhuǎn)錄的蛋白去快速地定位到編碼區(qū),加速表達(dá)。這樣加速響應(yīng)編碼區(qū)表達(dá)的DNA序列我們稱之為增強(qiáng)子enhancer。那么既然有增強(qiáng)子,有沒有沉默子呢silencer?也是有的,和增強(qiáng)子一樣,沉默子也有可能分布在上游,它們的功能可能是阻止蛋白前來與編碼區(qū)結(jié)合,而沉默這個(gè)地方的表達(dá)。就像是我們讀一本目錄錯(cuò)亂的書,看了目錄之后反而對(duì)應(yīng)到了不對(duì)的頁碼,阻止我們讀我們想要的故事。

現(xiàn)在我們終于找到了我們的故事,翻到了書的這一頁。如果是一本排版精美而繁復(fù)的書,一個(gè)故事在標(biāo)題和正文之間有可能穿插著一點(diǎn)導(dǎo)言,或者前景提要,而在這之后才是故事的主體部分。導(dǎo)言和前景提要是這篇小說的一部分,但可能并不是我們想要了解的故事情節(jié)的主體。因此,你有可能會(huì)見到首字下沉的排版(圖4),這個(gè)特殊的被放大的字用來預(yù)示著你:在這里才要開始故事正文。編碼區(qū)也是如此安排的。在編碼區(qū)內(nèi)部一開始會(huì)有一段和正式表達(dá)的內(nèi)容不相關(guān)的“廢話”(在術(shù)語上叫5' UTR, untranslated region),之后才開始真正要表達(dá)成終產(chǎn)物蛋白的部分。在編碼區(qū)之前有標(biāo)題一樣的啟動(dòng)子啟動(dòng)著整個(gè)區(qū)域開始轉(zhuǎn)錄與否,編碼區(qū)內(nèi)部也不是第一個(gè)位置就會(huì)被之后的翻譯表達(dá)出來,而是過了一小段之后才開始出現(xiàn)翻譯的起點(diǎn),也就是第一個(gè)密碼子,起始密碼子start codon。啟動(dòng)子的區(qū)域吸引來轉(zhuǎn)錄的蛋白開啟轉(zhuǎn)錄,轉(zhuǎn)錄出的結(jié)果被下一步翻譯的蛋白識(shí)別時(shí),識(shí)別的起始信號(hào)就是起始密碼子。

圖4:像這樣首字下沉的排版預(yù)示著這里起始本部分。DNA編碼區(qū)的起始密碼子有著一樣的預(yù)示效果。

我們終于開始津津有味地讀起故事來。故事的類型多種多樣,結(jié)尾也通常是無規(guī)律可循的。難道這就意味著我們?cè)谧x故事集的時(shí)候,除了讀到下一個(gè)故事的標(biāo)題,就沒法分辨出什么時(shí)候這個(gè)故事結(jié)束了嗎?顯然不是,任何一個(gè)有腦子的書都不會(huì)把兩個(gè)故事緊密排版在一起,讓我們辨認(rèn)不出來兩個(gè)故事。通常書中可能會(huì)有空出來部分,一些貼心的書還會(huì)在一篇文章的結(jié)尾放一個(gè)小標(biāo)記來暗示你本章到此結(jié)束。在我們的編碼區(qū)中,也有同樣的設(shè)置。而且設(shè)置的層級(jí)和起始一樣,也是兩個(gè)層級(jí):首先,每個(gè)編碼區(qū)都會(huì)有一個(gè)終止密碼子stop codon,這負(fù)責(zé)告訴下一步翻譯的蛋白:“翻譯到這里結(jié)束了”(因?yàn)槲闯墒靘RNA加工的時(shí)候不光在前面“加帽”,還在后面“加尾”);其次,在終止密碼子之后還會(huì)有一段額外的序列(3’UTR),告訴當(dāng)前工作的的轉(zhuǎn)錄酶要結(jié)束收工了。至此,這一段編碼區(qū)才算是真正的完成,而一個(gè)基因也就到此結(jié)束了。我們來看一下下面的這個(gè)圖5,來復(fù)習(xí)一下上面說到的復(fù)雜的過程:

圖5:上面是DNA序列,下面是初級(jí)未加工的mRNA。DNA中從左至右分別經(jīng)過了:第一個(gè)黃色區(qū)增強(qiáng)子/沉默子區(qū)域,之后會(huì)到達(dá)緊挨著編碼區(qū)的啟動(dòng)子,之后會(huì)開始進(jìn)入編碼區(qū)。編碼區(qū)一開始是5'UTR,這一段并不被翻譯出來。接著到了翻譯的起始位點(diǎn),起始密碼子;走過整個(gè)翻譯區(qū)段后,進(jìn)入翻譯終點(diǎn):終止密碼子。之后開始一小段3' UTR,編碼區(qū)就結(jié)束了。到此,這個(gè)基因就完全走完了。這就是一個(gè)基因的結(jié)構(gòu),包含從一開始的增強(qiáng)子/沉默子,啟動(dòng)子,加上編碼區(qū)。其中增強(qiáng)沉默和啟動(dòng)再加上5' UTR這些不被翻譯成終產(chǎn)物的區(qū)域又叫做調(diào)控序列,而編碼區(qū)中翻譯成蛋白的部分叫做開放閱讀框(open reading frame, ORF)。

2020年2月6日02:05:06

有意思的是,表達(dá)出了這個(gè)初級(jí)mRNA之后,表達(dá)的重要故事還沒有就此結(jié)束。




表觀遺傳就是指不改變DNA序列但是永久的(個(gè)體水平的永久,而不是能遺傳的永久)改變基因的表達(dá)情況。普通的遺傳中,我們認(rèn)為一個(gè)基因的遺傳效果改變必須通過DNA改變才可以;但是表冠遺傳指出,即使基因不發(fā)生沉默突變,也可以被永久關(guān)閉表達(dá)。這種調(diào)節(jié)方式是通過序列層面以上的層次調(diào)控的。你肯定知道DNA在細(xì)胞中不是裸露的,而是和組蛋白包裹成核小體。二纏繞成核小體的DNA實(shí)際上是處于“難以接近的狀態(tài)”。一段DNA基因大多時(shí)候只能和一個(gè)蛋白質(zhì)結(jié)合,如果DNA被組蛋白結(jié)合,轉(zhuǎn)錄酶就結(jié)合不上,轉(zhuǎn)錄不會(huì)開啟,基因就無法表達(dá)。這就是基本思想。而組蛋白的亞基上有外延出來的肽鏈尾巴,其上的氨基酸可以被加上不同的基團(tuán)被修飾,常見的是甲基化修飾和乙?;揎?。這些不同的修飾就是給不同的組蛋白打標(biāo)簽,使得這些組蛋白和DNA更加緊密結(jié)合,或者更加松弛而脫落,暴露出DNA被轉(zhuǎn)錄酶結(jié)合。一般的,H3K9位點(diǎn)(這里H和K是氨基酸縮寫,3和9是第幾個(gè)氨基酸)甲基化修飾、H3乙?;揎検情_啟基因;其他位點(diǎn)的甲基化修飾是關(guān)閉(一般不會(huì)考察這么細(xì)節(jié)的話,你可以認(rèn)為甲基化都是關(guān)閉)。被甲基化修飾的多個(gè)核小體還可以相互繼續(xù)凝聚,讓染色質(zhì)壓縮程度更高,更難松散解開DNA而表達(dá),達(dá)到長期關(guān)閉一個(gè)基因區(qū)域的功能。這種染色質(zhì)上特殊壓縮的區(qū)域就是異染色質(zhì)。XX性染色體就會(huì)隨機(jī)完全關(guān)閉一個(gè)的表達(dá),通過的就是表觀遺傳。先這樣解釋吧。其實(shí)不難,并且表冠遺傳在生物中大量存在。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 氨基酸是蛋白質(zhì)的基本結(jié)構(gòu)單位,參與合成蛋白質(zhì)的氨基酸有20種,可作為原料在核糖體工廠通過肽鍵連接形成多肽鏈,都有密...
    官敏慧閱讀 6,382評(píng)論 0 7
  • DNA是遺傳物質(zhì),是攜帶遺傳信息的載體。信息從基因的核苷酸序列中被提取出,用來指導(dǎo)蛋白質(zhì)合成的過程對(duì)地球上的所有生...
    oddxix閱讀 22,149評(píng)論 0 8
  • 書名基因社會(huì)作者(美)以太·亞奈(Itai Yanai) / (美)馬丁·萊凱爾(Martin Lercher)譯...
    xuwensheng閱讀 2,109評(píng)論 1 11
  • 前一天,還在跟梅吹噓,自己不愛感冒。不知怎得,感冒就找上了我。老祖宗告訴我們的,話不能亂說,藥不能亂吃,...
    小寧_3a7c閱讀 497評(píng)論 1 3
  • 字典說,喪失感覺。 每個(gè)人對(duì)"麻"定義不一樣,也許自己眼中的"歲月安好"狀態(tài),在別人認(rèn)為就是頹。 此系列只是紀(jì)錄我...
    麥曉洛閱讀 192評(píng)論 0 0

友情鏈接更多精彩內(nèi)容