碎碎念:這一小節(jié)極其硬核,除了一上來就放一些語焉不詳?shù)墓接?jì)算,還有一些關(guān)鍵概念和上一節(jié)解釋不同。。。我估計(jì)得多讀幾遍/查查其他資料才能了解在說什么。這段翻譯就先按照原文來。
遺傳上來看,你和你旁邊的家伙差球不多。在人類基因組里的32億DNA堿基中,99.9%都是一毛一樣的。不過,即使只有千分之一的堿基不同,也因?yàn)檎麄€(gè)基因組太大了,你和你的鄰居還是有三百萬個(gè)堿基對(duì)是不一樣的。
在人類和其他物種中,基因組上多態(tài)性(polymorphism)的分布并不均勻(圖8)。通常,在基因間區(qū)和內(nèi)含子(intron)上多態(tài)性的比例高更多。[基因間的序列和內(nèi)含子都是不被表達(dá)成產(chǎn)物的序列]。 編碼區(qū)(外顯子,exon)則變化更少,尤其是每個(gè)密碼子(codon)的前兩個(gè)堿基。這些規(guī)律在整個(gè)生命樹上都極其普遍,可見其背后體現(xiàn)了演化中普遍的規(guī)律。

這里的內(nèi)含子、外顯子、密碼子、為什么是前兩個(gè)堿基、單核苷酸多態(tài)性等等都是分子生物學(xué)的內(nèi)容。之后寫科普時(shí)會(huì)更多地解釋。
這個(gè)規(guī)律就是物種內(nèi)大部分的DNA多態(tài)性都來自于受到漂變影響的選擇中性突變(selectively neutral mutations)。平均的,二倍體物種中,一個(gè)受到漂變影響的中性突變位點(diǎn)的雜合度的預(yù)估值應(yīng)該是:

在這里μn是中性突變率,也就是:每一代中,一個(gè)位點(diǎn)突變成另外一個(gè)不影響個(gè)體適合度(fitness)的等位基因的概率。比如說,如果一個(gè)位點(diǎn)的總共突變率是μ=10^(-6),但是這其中只有10%的突變是選擇中性的,那么中性突變率就是μn=0.1×10^(-6)=10^(-7).
等式7.1中有三個(gè)因子:1. 追溯回兩個(gè)基因拷貝合并事件所需要的代際時(shí)間(2Ne,前文講過);2. 該位點(diǎn)在一代中出現(xiàn)選擇中性的突變的概率,也就是中性突變率μn;3. 等式還要乘以2是因?yàn)閇從概率上說]突變可以發(fā)生在追溯到合并事件之前的兩個(gè)分支中的任何一支***。(等式7.1是一個(gè)估計(jì)值,當(dāng)π小于等于0.1時(shí),就是精確值,而且這也是大部分生物符合的情況。)總結(jié)一下,這個(gè)等式告訴我們,多態(tài)性 [的一種體現(xiàn),雜合度] 會(huì)隨著有效種群大小和中性進(jìn)化率的增加而增加。
***補(bǔ)充:為什么等式中要乘以2呢?

2020年1月12日23:37:03
這個(gè)簡單的結(jié)果 [指上文的等式] 解釋了基因組中遺傳多樣性的一個(gè)重要規(guī)律。大部分的發(fā)生在編碼區(qū)的突變是“非同義的(nonsynonymous)”,這些突變改變了合成的氨基酸。并且大部分的蛋白里的突變都是有害的(也就是降低生物的存活率或繁殖效率)(詳見第四章)。這些有害突變在種群中一般都被一個(gè)叫做純化選擇(purifying selection)的過程清除了。[純化選擇的另外一個(gè)說法是負(fù)選擇(negative selection),和正選擇對(duì)應(yīng),意思是有害的突變被清除。] 這樣的突變不會(huì)對(duì)我們可觀測到的雜合度做出貢獻(xiàn)。那些會(huì)經(jīng)歷純化選擇的位點(diǎn)稱為是受到選擇約束(selective constraint)的。它們的中性突變率要小于總突變率。[因?yàn)橹行酝蛔兟?總突變率-非中性突變率,而這些位點(diǎn)有很強(qiáng)的選擇壓,也就是一旦發(fā)生突變,性質(zhì)還是中性的可能性很低,大部分的突變都會(huì)受到選擇的影響,所以它們的非中性突變率很高,進(jìn)而中性突變率就低]。相反的,許多非編碼區(qū)的位點(diǎn)由于突變不影響適合度,所以這些區(qū)域的中性突變率就等于總突變率。[就算這些位點(diǎn)變出花來,由于不影響蛋白的合成,對(duì)蛋白功能就沒有影響,也進(jìn)而就不影響適合度]。因此,非編碼區(qū)通常也就有更高的雜合度,這符合等式7.1的預(yù)測。
同樣的邏輯還能解釋編碼區(qū)的不同位置的差異規(guī)律。許多密碼子的第三個(gè)堿基是“同義的synonymous”,[也就是由于密碼子具有簡并性(codon degeneracy),突變后的密碼子合成的還是同樣的氨基酸,蛋白在功能上沒有變化。] ,但是前兩位的突變是非同義突變。因此密碼子的前兩個(gè)堿基就有低得多的中性突變率,也就更少有多態(tài)性。[這句話同時(shí)暗示了,密碼子的第三個(gè)堿基一般有高得多的中性突變率,也就更多樣] 圖8中的Adh位點(diǎn)體現(xiàn)了這一點(diǎn):內(nèi)含子的17個(gè)突變中,只有一個(gè)是非同義突變。
這里中性突變位點(diǎn)和多態(tài)性的關(guān)系很好理解。凡是中性突變率高的位點(diǎn)多態(tài)性都高。高的中性突變率意味著它們的突變體大多數(shù)是中性的,不影響個(gè)體生存,所以不會(huì)被選擇效果清除掉,就可以保留下來,因而我們就能觀測到這些位置上有更多種堿基類型,也就保留了更多的多樣性。相對(duì)的,非同義突變位點(diǎn)由于突變后合成的氨基酸不一樣,會(huì)影響功能,并且大多數(shù)都是有害突變。一變出來就被選擇效果清除了(比如這個(gè)蛋白功能異常之后,個(gè)體不能存活直接死亡,這個(gè)突變體就沒了),因此剩余的還活著的、能被人類觀測到的類型都是那些穩(wěn)穩(wěn)妥妥的保持原樣不改變的一種類型,因此這些位置的多態(tài)性就低。
問題記錄-8:為什么說純化選擇的位點(diǎn)不會(huì)產(chǎn)生雜合度?純化選擇會(huì)讓純合子比例增多嗎?還是不一定?如果雜合子的基因不是致死的,是不是就不會(huì)被純化?
2020年1月13日23:39:32
2020年1月14日22:50:02:明天課多,今日太困。我要咕了(理直氣壯且大聲)。
總的來說,對(duì)于基因組上那些能免于選擇效果的位點(diǎn),他們的突變都是中性突變。這些突變在種群中會(huì)只會(huì)受到漂變的影響,因此就像它們該做的那樣為種群貢獻(xiàn)了雜合度。但是對(duì)于那些受到選擇影響的位點(diǎn),它們大部分的突變都是有害的。因此會(huì)被選擇效應(yīng)從種群中清出去,因而幾乎對(duì)雜合度沒有貢獻(xiàn)。這些位點(diǎn)也因此就更少變。
除此之外,多態(tài)性程度也和染色體有系統(tǒng)的聯(lián)系。那些有更高重組率的區(qū)域會(huì)更多態(tài)(圖9)。我們已經(jīng)在第五章講過選擇清除(selective sweep,圖S5),是說由于有益突變在基因組中被固定下來,該突變周圍的一小塊區(qū)域也隨之?dāng)U散,[每個(gè)基因組都帶著有益突變和其兩邊一樣的序列,] 因此這片連帶區(qū)域多樣性就降低了。同樣的,當(dāng)選擇清除了有害突變時(shí),該突變周圍的多態(tài)性也下降了。這種效應(yīng)叫背景選擇(background selection,圖10)。選擇清除和背景選擇都會(huì)影響染色體上重組率低的部分的一串區(qū)域,導(dǎo)致了圖9所見的情況。選擇清除和背景選擇讓基因組上中性突變位點(diǎn)的多樣性低于等式7.1所預(yù)測的值。



2020年1月16日00:23:30
2020年1月17日00:13:29 還在預(yù)習(xí)土壤學(xué)。我是弟弟。我要預(yù)習(xí)不完了,明天的小測要死了(下周開始更新土壤學(xué),進(jìn)化這個(gè)先擱淺(說鴿就鴿?)。
2020年1月18日23:12:15(今天假期,我又理直氣壯地鴿了)
估計(jì)種群大小
雜合度和種群大小的關(guān)系暗示了一種估計(jì)某一物種有效種群大小的方式。這個(gè)想法就是首先,通過挑選基因組上呈現(xiàn)選擇中性的位點(diǎn),測序計(jì)算出不同個(gè)體這些位點(diǎn)的雜合度π(通常我們都測的是內(nèi)含子上的突變)。其次,我們還可以使用第四章提到的方法 [我也沒看是什么方法,咕!] 來估計(jì)全部的突變率(μ)。因?yàn)槲覀冴P(guān)注的是選擇中性的位點(diǎn),所以它們的總體突變率就等于中性突變率μn。最后,我們就得到了等式7.1中所有的其他變量,帶入等式7.1就可以計(jì)算對(duì)應(yīng)這個(gè)位點(diǎn)的多態(tài)性而估計(jì)出的效種群大小Ne,然后計(jì)算多個(gè)位點(diǎn)之后取平均值,就可以估計(jì)這個(gè)物種有效種群大小。
用這種方式我們已經(jīng)估計(jì)了一些物種的有效種群大?。▓D11)。這其中最小的結(jié)果來自人類,這個(gè)物種有效種群大小只有大概一萬。盡管現(xiàn)在全球有七十億人口,但是幾千代之前我們的人口小得多的多。

2020年1月21日00:52:29 今天又是摸魚更新。。。本來想著假期多更新一點(diǎn)把前幾天的鴿子坑填上。。。結(jié)果失策了。。。
2020年1月22日01:39:20 咕咕咕。。。開學(xué)之后真是天天咕咕。。。我作業(yè)都寫不完了。。。
這種方法再應(yīng)用地遠(yuǎn)一點(diǎn),我們可以做更妙的事情:我們可以僅僅通過一個(gè)個(gè)體來估計(jì)整個(gè)種群的有效大小。這就是對(duì)這個(gè)物種全基因組測序,得到一大堆選擇中性位點(diǎn)的突變率,取平均值,之后用這個(gè)帶入等式7.1,就可以計(jì)算出Ne。另外一個(gè)DNA多態(tài)性的常見作用是估計(jì)歷史上的種群大小。我們之前討論過的斑馬雀的就是一個(gè)好例子?,F(xiàn)在澳大利亞島上的斑馬雀有將70萬左右,而根據(jù)對(duì)他們遺傳多樣性的研究表明,這70萬個(gè)體只是歷史上一個(gè)大概有一萬九百多只鳥的小種群的后代,它們生活在距今兩百萬年前。
不同動(dòng)物的雜合度π均值差別很大。目前來看,螞蟻和脊椎動(dòng)物傾向于有較小的遺傳變異,而蝴蝶和雙殼綱(也就是蚌殼那一類玩意兒)有很高的雜合度。有效種群大小是導(dǎo)致這種差異的一個(gè)原因,不過突變率、選擇清除、背景選擇和其他的因素也都影響了雜合度。更神奇的是,一般來說,繁殖率高并且繁殖體[對(duì)于有性生殖的動(dòng)物,可以理解為受精卵或者幼崽。但是實(shí)話,動(dòng)物很少用這個(gè)概念。一般繁殖體propagule是指可以無性生殖/營養(yǎng)生殖的部分。更多用于植物菌物和細(xì)菌古菌] 小的生物傾向于有更高的雜合度(圖12)。不過究竟這些生活史上的因素怎么影響雜合度的,我們還沒搞懂。

2020年1月23日23:07:01
問題記錄:總結(jié)一下利用雜合度估計(jì)Ne的方法,去了解一下還有什么方法。這種方法發(fā)弊端和優(yōu)勢在哪里。查篇實(shí)驗(yàn)文獻(xiàn)看看具體的測量和應(yīng)用是怎么樣的。