擬南芥自交植株雄性配子數(shù)量的適應(yīng)性減少

今天分享一篇來自nature communication上的文章,發(fā)表于今年6月份,題目為:Adaptive reduction of male gamete number in the selfing plant Arabidopsis thaliana

Abstract

雄性配子的數(shù)量是繁殖成功的關(guān)鍵,而且在不同物種之間和物種內(nèi)部都有差異。包含雄配子的花粉粒數(shù)量的演化性減少在自交植物中廣泛存在。在此,我們使用全基因組關(guān)聯(lián)分析(GWAS)來識(shí)別潛在的基因座,并評(píng)估主要自交植物擬南芥中與花粉數(shù)量相關(guān)的位點(diǎn)選擇信號(hào)。選擇標(biāo)記在與花粉數(shù)密切相關(guān)的區(qū)域被富集,表明受多基因選擇。我們?cè)陉P(guān)聯(lián)最強(qiáng)的位點(diǎn)分離得到了REDUCED POLLEN NUMBER1 (RDP1)基因。我們使用CRISPR / Cas9產(chǎn)生的無效突變體在非標(biāo)準(zhǔn)野生種中進(jìn)行定量互補(bǔ)試驗(yàn)來驗(yàn)證其作用。與多效性無效突變體相比,僅花粉數(shù)量受到天然等位基因變異的顯著影響。這些數(shù)據(jù)支持了減少雄性配子的投入對(duì)主要自交物種有利的理論預(yù)測(cè)。

Introduction

種子植物的花粉粒數(shù)(每個(gè)花粉粒含有兩個(gè)精子細(xì)胞)和動(dòng)物的精子數(shù)反映的雄性配子數(shù),已經(jīng)從農(nóng)業(yè)、醫(yī)學(xué)和進(jìn)化論的觀點(diǎn)得到了廣泛的研究。進(jìn)化理論預(yù)測(cè),繁殖系統(tǒng)可以作為雄性配子數(shù)量的主要選擇力量。在高度混雜的異交物種中,由于雄性配子的競(jìng)爭(zhēng),應(yīng)該產(chǎn)生大量的雄性配子,因此減少雄性配子數(shù)量被認(rèn)為是有害的。相反,它們?cè)谳^低的異交率下可能是有利的,因?yàn)樗鼈兊纳a(chǎn)成本高,降低了適應(yīng)性。在農(nóng)業(yè)環(huán)境中,低花粉數(shù)在馴化過程中可能被選擇了,但這可能成為小麥和其他物種雜交育種的障礙。在開花植物中,通過失去自交不親和而從異交過渡到自交育種系統(tǒng)是最普遍的進(jìn)化趨勢(shì)之一。自交種群或種通常表現(xiàn)為每朵花的花粉粒數(shù)較低(以下簡(jiǎn)稱花粉數(shù))以及花的大小變小。關(guān)于花粉數(shù)量的減少是適應(yīng)性進(jìn)化的結(jié)果,還是由于選擇減少導(dǎo)致的有害突變的積累,一直存在著爭(zhēng)論,但對(duì)于花粉數(shù)量變化的遺傳基礎(chǔ),評(píng)估其選擇的分子特征,人們還知之甚少。

為了闡明花粉數(shù)量自然變異的遺傳基礎(chǔ),我們?cè)谶@里集中研究以自交為主的擬南芥。研究表明,該物種的優(yōu)勢(shì)自交進(jìn)化比其異交近緣種的進(jìn)化發(fā)生得更近。因此,除了與這些異交近緣種存在固定的、基于遺傳的差異外,我們預(yù)計(jì)在目前的遺傳中,花粉數(shù)量的差異可能仍然是分離的。通過利用花粉的遺傳和基因組資源,我們進(jìn)行了花粉數(shù)量變異的全基因組關(guān)聯(lián)分析。我們發(fā)現(xiàn),RDP1基因的自然變異賦予花粉數(shù)量的變異,而沒有可檢測(cè)的多效性。在全基因組關(guān)聯(lián)分析(GWAS)相關(guān)聯(lián)峰頂?shù)倪x擇信號(hào)中,包括了RDP1位點(diǎn),支持了在自交物種中減少雄性配子投入應(yīng)可為其提供優(yōu)勢(shì)的理論預(yù)測(cè)。

Results

全基因組關(guān)聯(lián)分析及選擇信號(hào)

為了研究花粉數(shù)量在一個(gè)物種范圍內(nèi)的變化,我們測(cè)定了144個(gè)天然擬南芥種質(zhì)中每朵花的花粉數(shù)量(Fig. 1a–d; Supplementary Table 1 and Supplementary Data 1),發(fā)現(xiàn)了大約四倍的變異(平均約4000)(Fig. 1e)。代表性雄蕊標(biāo)本的組織學(xué)切片證實(shí)了不同標(biāo)本間花粉數(shù)量的變化(Fig. 1c, d)。我們還測(cè)量了每朵花的胚珠數(shù)量(Supplementary Table 2)。我們沒有發(fā)現(xiàn)花粉粒數(shù)和胚珠數(shù)之間存在顯著的相關(guān)關(guān)系(P = 0.5164),盡管在物種間比較中經(jīng)常出現(xiàn)負(fù)相關(guān),這是由于在資源分配上對(duì)雄性和雌性功能的權(quán)衡,在理論基礎(chǔ)上所預(yù)期的。此外,我們發(fā)現(xiàn),每朵花的花粉數(shù)與107個(gè)已發(fā)表的開花表型、防御表型、ionomic和發(fā)育性狀的任何一個(gè)都沒有顯著相關(guān)(Supplementary Table 3; Supplementary Note 1),與氣候變量、地理位置或144個(gè)物種的S-單倍群也沒有顯著相關(guān)(Supplementary Tables 4 and 5, Supplementary Fig. 1)。這些數(shù)據(jù)表明,花粉數(shù)量的變化很大程度上與其他性狀無關(guān)。

Fig. 1

為了評(píng)估與配子數(shù)有關(guān)的基因座的全基因組自然選擇特征,我們首先利用這些系的全基因組單核苷酸多態(tài)性(SNP)數(shù)據(jù)集對(duì)花粉和胚珠數(shù)進(jìn)行GWAS,該數(shù)據(jù)集是根據(jù)全基因組重測(cè)序數(shù)據(jù)和250k SNP數(shù)據(jù)進(jìn)行估算得到的(Fig. 1f, h; Supplementary Fig. 2)。共鑒定出68個(gè)關(guān)聯(lián)峰(10-kb windows having SNPs with P?<?10–4),但經(jīng)Bonferroni校正后,只有一個(gè)與花粉數(shù)相關(guān)聯(lián)的峰保持顯著性。針對(duì)已鑒定的GWAS峰,我們進(jìn)行了富集分析,以了解花粉和胚珠數(shù)量相關(guān)峰是否在長(zhǎng)單倍型區(qū)域富集,這一區(qū)域可能存在部分或正在進(jìn)行分離多態(tài)性的清除。為了識(shí)別長(zhǎng)單倍型區(qū)域,我們首先計(jì)算了擴(kuò)展單倍型的純合性(EHH),它測(cè)量了攜帶特定核心等位基因的單倍型的衰減,作為距離的函數(shù)。然后,我們獲得了每個(gè)SNP的綜合單倍型得分(iHS)統(tǒng)計(jì)量,通過控制等位基因上每個(gè)SNP的頻率來比較兩個(gè)等位基因之間SNP的EHH。我們發(fā)現(xiàn)包括花粉數(shù)相關(guān)位點(diǎn)在內(nèi)的10kb窗口在極端iHS尾部顯著富集(P?<?0.05, permutation test; Fig. 1i, j; Supplementary Fig. 3)。這些位點(diǎn)通常顯示較高的iHS評(píng)分,GWAS前五個(gè)峰值中的兩個(gè)是全基因組iHS分布的異常值(Supplementary Table 6)。富集對(duì)樣品組成的變化、等位基因頻率的截?cái)嗪痛翱诘氖褂檬菑?qiáng)有力的(Supplementary Figs. 4–6; see Supplementary Note 2 for details)。胚珠數(shù)也顯示富集,但少于花粉數(shù)(Fig. 1j)。理論上,重組率和估算的準(zhǔn)確性可以混淆 iHS 富集。為了處理這些潛在的混雜因素,我們將這些結(jié)果與107個(gè)其他表型GWAS峰的iHS富集分析結(jié)果(P < 0.0001)進(jìn)行了比較,因?yàn)檫@些混雜因素也應(yīng)該會(huì)影響其他性狀的富集。我們發(fā)現(xiàn),相對(duì)于開花時(shí)的葉片數(shù)量和對(duì)假單胞菌病原體的抗性等107種表型中已知的適應(yīng)性性狀,iHS對(duì)花粉數(shù)量GWAS峰(P?=?0.002 for the top 1% iHS tail; Supplementary Fig. 3)的富集是最高的(Supplementary Table 7)。此外,iHS對(duì)胚珠數(shù)GWAS峰的富集也較顯著(P?=?0.030 for the top 1% iHS tail; Supplementary Fig. 3)。這些富集結(jié)果支持在整個(gè)基因組中與雄性和雌性配子數(shù)量相關(guān)的相當(dāng)數(shù)量的基因座上進(jìn)行了多基因選擇。

Isolation of the REDUCED POLLEN NUMBER1 gene
為了進(jìn)一步了解花粉數(shù)量變異的分子基礎(chǔ)和檢驗(yàn)假定的選擇靶點(diǎn)的性質(zhì),我們?cè)噲D鑒定花粉數(shù)量變異的基因;然而,前五個(gè)關(guān)聯(lián)峰中沒有任何已知的在早期雄蕊和花粉發(fā)育中功能的基因。為獲得花粉數(shù)量變化基因的實(shí)驗(yàn)證據(jù),我們對(duì)花粉數(shù)量相關(guān)的最高GWAS峰下的基因進(jìn)行了功能分析,這解釋種質(zhì)間總表型變異的約20%,并且滿足全基因組顯著性標(biāo)準(zhǔn)(-log10 P = 7.60)。這個(gè)區(qū)域特別有趣,因?yàn)樗矟M足了 iHS 統(tǒng)計(jì)數(shù)據(jù)的全基因組顯著性標(biāo)準(zhǔn)(P?=?0.0149; Fig. 1i, Supplementary Fig. 7),表明了選擇性的清除。為了檢驗(yàn)該區(qū)域的選擇特征是否可能是由花粉數(shù)量以外的性狀決定的,我們檢查了107個(gè)已發(fā)表的表型、胚珠數(shù)量或顯示氣候相關(guān)的變異是否存在關(guān)聯(lián)信號(hào)。在包含花粉數(shù)GWAS得分最高的SNP的10 kb窗口中,我們沒有發(fā)現(xiàn)基因型-表型相關(guān)性低于P < 10-5,也沒有發(fā)現(xiàn)氣候-SNP相關(guān)性低于經(jīng)驗(yàn)P值(P < 0.01),即在這一區(qū)域,除花粉數(shù)量外,其他性狀的選擇沒有明顯的證據(jù)。我們還發(fā)現(xiàn),如果長(zhǎng)單倍型是為了減少花粉數(shù)量而選擇的(P?=?2.152?×?10–6, t test; population structure-corrected GWAS P?=?2.95?×?10–6; Fig. 1k),那么長(zhǎng)單倍型變異比替換單倍型變異產(chǎn)生的花粉數(shù)更少。
在GWAS評(píng)分最高的這一染色體區(qū)域的三個(gè)基因中(AT1G25250, AT1G25260, and AT1G25270; Fig. 1g),功能未知的AT1G25260基因在花芽中的表達(dá)水平遠(yuǎn)高于其他兩個(gè)基因(Supplementary Fig. 8)。因此,我們從Nottingham擬南芥儲(chǔ)存中心獲得了兩個(gè)標(biāo)準(zhǔn)Col-0型AT1G25260 T-DNA插入的突變體。這些突變體的花粉數(shù)量減少了32%(Fig. 2a; Supplementary Table 8)。下面我們將AT1G25260稱為REDUCED POLLEN NUMBER1 (RDP1)。由于rdp1-1(insertion in the 5′ UTR)和rdp1-2(insertion at the end of the coding sequence) (Fig. 2b)純合子表達(dá)水平較低,可能是亞型突變體(Supplementary Fig. 8)。在Col-0背景下,我們使用CRISPR/Cas9系統(tǒng)生成了RDP1的兩個(gè)漸變移碼突變體(rap1-3和rap1-4)。這些突變體的花粉數(shù)量的確減少得更多,但仍然產(chǎn)生了相應(yīng)野生型的大約一半的花粉粒(53% for rdp1-3; Fig. 2a),說明了RDP1效應(yīng)的數(shù)量特性?;ǚ鄞笮÷杂性黾?,與眾所周知的花粉數(shù)量與大小呈負(fù)相關(guān)關(guān)系一致,即使在相同基因型內(nèi)也是如此(Supplementary Fig. 9; Supplementary Table 9)。突變表型通過轉(zhuǎn)化包含RDP1的Col-0中4.3kb的基因組片段得到補(bǔ)充(Fig. 2a, Supplementary Fig. 9)。與RDP1突變體相比,CRISPR/Cas9誘導(dǎo)的AT1G25250或AT1G25270缺失突變體花粉數(shù)量沒有顯著變化(Supplementary Fig. 10)。RDP1 4個(gè)獨(dú)立突變體的表型以及利用野生型等位基因的成功互補(bǔ)表明,RDP1參與了花粉數(shù)量的控制。

Fig. 2

基于系統(tǒng)發(fā)育分析,RDP1是酵母mRNA周轉(zhuǎn)4蛋白(Mrt4p)的同源物(Supplementary Figs. 11 and 12)。MRT4基因在酵母菌中不是必需的,但其突變體表現(xiàn)出稍微緩慢的生長(zhǎng)表型。Mrt4p與核糖體P0蛋白具有相似性,是P0蛋白組裝到核糖體中所必需的。據(jù)報(bào)道,人核糖體P0基因在癌癥中通過調(diào)節(jié)細(xì)胞增殖具有外核糖體的功能。在花藥發(fā)育過程中,產(chǎn)孢細(xì)胞首先分裂并分化為小孢子細(xì)胞。小孢子細(xì)胞減數(shù)分裂后,形成四個(gè)小孢子,每個(gè)小孢子經(jīng)過兩次有絲分裂,形成含有雄配子的成熟花粉粒。rdp1-3突變體產(chǎn)生的小孢子細(xì)胞比野生型少(Fig. 2c–e),表明在減數(shù)分裂前細(xì)胞數(shù)量的減少。與此一致的是,原位mRNA雜交實(shí)驗(yàn)檢測(cè)到RDP1在產(chǎn)孢細(xì)胞及其衍生的小孢子細(xì)胞中表達(dá)強(qiáng)烈,而在小孢子中沒有(Fig. 2f, g; Supplementary Fig. 13)。RDP1在其他增殖細(xì)胞中也有表達(dá),包括在花序、花分生組織和胚珠中(Supplementary Figs. 8 and 13),表明其在增殖對(duì)核糖體生物生成要求較高的細(xì)胞類型中具有更廣泛的作用。此外,將RDP1啟動(dòng)子融合到uidA報(bào)告基因編碼的葡萄糖醛酸酶(GUS)來評(píng)估其活性,證實(shí)了RDP1在雄蕊中的表達(dá)模式(Supplementary Fig. 14),并在營(yíng)養(yǎng)期的根尖和幼葉原體中顯著表達(dá);這些數(shù)據(jù)得到了反轉(zhuǎn)錄定量PCR實(shí)驗(yàn)的支持(Supplementary Fig. 8b)。與RDP1在增殖組織中的表達(dá)一致,rdp1-3缺失突變體表現(xiàn)出多效表型,包括營(yíng)養(yǎng)生長(zhǎng)緩慢和每花胚珠數(shù)量減少(Supplementary Fig. 15)。由于這些多效表型在自然環(huán)境中是有害的,這些數(shù)據(jù)表明,RDP1的自然等位基因不是無效突變(see below)。綜上所述,這些數(shù)據(jù)表明RDP1在擬南芥細(xì)胞的增殖中是必需的,然而我們所鑒定的自然變異主要影響花藥中孢源細(xì)胞的增殖,這與它的酵母同源物在細(xì)胞增殖中的功能一致。

RDP1的自然變異導(dǎo)致了花粉數(shù)量的變異

很難通過實(shí)驗(yàn)確定一個(gè)特定的基因是否具有對(duì)定量性狀具有微妙表型影響的天然等位基因。當(dāng)?shù)任换蛐?yīng)較弱時(shí),對(duì)天然等位基因的轉(zhuǎn)基因分析不夠有力,因?yàn)檗D(zhuǎn)基因的擬南芥植株由于株系之間的差異,其表型往往高度可變,例如由于轉(zhuǎn)基因插入位點(diǎn)的不同而導(dǎo)致的表型差異。相反,如果其他基因座的影響很小,定量互補(bǔ)試驗(yàn)可以通過檢測(cè)自然等位基因在雜合狀態(tài)下對(duì)空等位基因的影響來識(shí)別責(zé)任基因,盡管這可能會(huì)被遺傳背景中的多基因效應(yīng)所混淆。為了進(jìn)行這種定量互補(bǔ),我們利用CRISPR/Cas9技術(shù)在沒有現(xiàn)成突變體的非標(biāo)準(zhǔn)自然培養(yǎng)基中生成移碼的無效等位基因。

我們使用了分別具有高花粉數(shù)和低花粉數(shù)表型的Bor-4和Uod-1株系(Fig. 2b; Fig. 3)。從起始密碼子上游777 bp到終止密碼子下游643 bp,包含RDP1基因的區(qū)域中,兩種基因的序列存在一些差異。在編碼區(qū)發(fā)現(xiàn)1個(gè)非同義替換和6個(gè)同義替換,在非編碼區(qū)發(fā)現(xiàn)62個(gè)置換和6個(gè)indel突變(Supplementary Fig. 16)。但兩種種質(zhì)均未出現(xiàn)明顯的功能缺失突變(Supplementary Fig. 16),且每個(gè)種質(zhì)的rdp1 CRISPR突變體的花粉數(shù)量同相應(yīng)的野生型相比均減少(P?<?2.2?×?10–16 for Bor-4, P?=?9.84?×?10–7 for Uod-1; Fig. 3a, b; Fig. 2h)。這些結(jié)果表明,這兩個(gè)自然發(fā)生的RDP1基因變異不是無效突變,而是編碼功能蛋白。RDP1的破壞對(duì)Bor-4花粉數(shù)量的影響強(qiáng)于Uod-1(analysis of variance (ANOVA) interaction effect P?=?1.07?×?10–5; Fig. 2h)。這一發(fā)現(xiàn)支持了Bor-4等位基因比Uod-1等位基因?qū)ǚ蹟?shù)量的促進(jìn)作用更強(qiáng)的觀點(diǎn),盡管Bor-4和Uod-1遺傳背景中的其他位點(diǎn)可能通過上位作用導(dǎo)致了這種差異。

為了檢驗(yàn)RDP1的等位基因效應(yīng),我們采用了控制遺傳背景的定量互補(bǔ)試驗(yàn)(Fig. 3)。在每個(gè)遺傳背景下通過雜合子進(jìn)行移碼突變獲得的F1植株中,我們比較了兩種基因型:RDP1Bor/rdp1Uod vs. rdp1Bor/RDP1Uod。這些F1基因型是相同的,除了在RDP1的差異,他們都攜帶一個(gè)移碼等位基因,但功能等位基因有所不同;由于雜交設(shè)計(jì),CRISPR/Cas9誘變所產(chǎn)生的任何獨(dú)立分離的脫靶效應(yīng)都將在兩個(gè)目標(biāo)基因型組群中平均分配。我們發(fā)現(xiàn),帶有RDP1Uod的株系花粉數(shù)量顯著低于帶有RDP1Bor的植株(nested ANOVA, 468 flowers from 26 individuals of RDP1Bor/rdp1Uod and 368 flowers from 20 individuals of rdp1Bor/RDP1Uod, P?=?4.85?×?10–8; Fig. 3c)。這種顯著性差異不能歸因于隨機(jī)個(gè)體差異,因?yàn)橥ㄟ^單獨(dú)使用每個(gè)個(gè)體的平均數(shù)據(jù)進(jìn)行個(gè)體檢驗(yàn),也觀察到具有功能RDP1BorRDP1Uod等位基因的植株之間存在顯著性差異(P = 0.0331)。因此,在其他相同的遺傳背景下,各自功能性的RDP1單倍型會(huì)導(dǎo)致花粉數(shù)量的差異。我們還對(duì)兩組植株的蓮座葉大小、花期、胚珠數(shù)、干重和種子重進(jìn)行了測(cè)定,但RDP1Bor/rdp1Uodrdp1Bor/RDP1Uod在這些性狀上均無顯著差異(Supplementary Fig. 17)。因此,與實(shí)驗(yàn)生成的具有多效性生長(zhǎng)缺陷的無效突變體相比,這些結(jié)果表明,在沒有任何可檢測(cè)到的有害多效性的情況下,RDP1的天然等位基因差異會(huì)影響花粉數(shù)量。如上所述,其他性狀的基因型-表現(xiàn)型關(guān)聯(lián)也支持這一發(fā)現(xiàn)。

Discussion

在此,我們分離了致使雄性配子數(shù)量自然變異的RDP1基因。本研究為包括RDP1在內(nèi)的花粉數(shù)量相關(guān)基因座的多基因選擇提供了依據(jù)。盡管RDP1編碼的核糖體生物發(fā)生因子將是增殖生長(zhǎng)所必需的,但自然選擇的等位基因仍主要導(dǎo)致花粉數(shù)量減少。這類似于人類G6PD基因的一個(gè)亞型等位基因,該基因編碼戊糖磷酸途徑中的一種酶,由于對(duì)瘧疾的抗性選擇,該基因具有長(zhǎng)單倍型。

Fig. 3

擬南芥異種雜交群體的平均花粉粒數(shù)約為18000,比我們的擬南芥中花粉粒數(shù)高出數(shù)倍(~2000–8000; Fig. 1e)。盡管導(dǎo)致A. thalianaA. lyrata的譜系之間的進(jìn)化分裂估計(jì)發(fā)生在大約500萬年前或更早,幾項(xiàng)研究表明,擬南芥中占主導(dǎo)的自交是最近才進(jìn)化出來的(0-0.413 million years ago based on the timing of the loss of a self-incompatibility gene, ~0.5 million years ago based on the abundance of transposable elements, and ~0.3–1 million years ago based on the pattern of genome-wide linkage disequilibrium)。因此,除了可能固定的遠(yuǎn)親異交同族的差異外,可以想象一些潛在的基因座,不僅限于而且包括 RDP1的位點(diǎn)在A. thaliana內(nèi)部仍然是分離的。這可能反映了進(jìn)一步減少花粉數(shù)量的一個(gè)正在進(jìn)行的選擇過程,這被認(rèn)為是所謂的自受精綜合征的一個(gè)標(biāo)志。雖然我們注意到RDP1和其他分離位點(diǎn)的部分清除可能與向優(yōu)勢(shì)自交的過渡沒有直接關(guān)系,但我們的分析沒有發(fā)現(xiàn)其他選擇力的證據(jù),包括局部適應(yīng)、氣候關(guān)聯(lián)或其他性狀的多效選擇。因此,我們的研究支持了減少雄性配子投入對(duì)自交占優(yōu)勢(shì)的物種有利的理論預(yù)測(cè)。

我們的研究還表明,利用基于CRISPR/ Cas9的等位基因進(jìn)行數(shù)量互補(bǔ)實(shí)驗(yàn)將GWAS和功能分析進(jìn)行了結(jié)合,為剖析數(shù)量性狀自然變異背后的等位基因差異提供了一種強(qiáng)有力的方法。


原文
Tsuchimatsu, T., Kakui, H., Yamazaki, M. et al. Adaptive reduction of male gamete number in the selfing plant Arabidopsis thaliana. Nat Commun 11, 2885 (2020). https://doi.org/10.1038/s41467-020-16679-7


補(bǔ)充:
選擇性清除(Selective sweep):在中性進(jìn)化理論下,一個(gè)新的突變往往需要很長(zhǎng)一段時(shí)間才能夠在群體中達(dá)到一個(gè)較高的頻率,并且這些突變周圍的連鎖不平衡程度會(huì)因重組率的影響而在這段時(shí)間內(nèi)幾乎完全衰減降解。因此,基因組上絕大多數(shù)未受到選擇作用的位點(diǎn)會(huì)始終處于隨機(jī)漂變狀態(tài),彼此之間形成的連鎖不平衡容易衰減,單倍型長(zhǎng)度相對(duì)較短。然而在選擇的作用下,群體有利等位基因頻率則會(huì)在較短的時(shí)間內(nèi)達(dá)到一個(gè)較高的值,重組的作用會(huì)受到一定程度的對(duì)沖而不能對(duì)長(zhǎng)范圍單倍型造成實(shí)質(zhì)性的降解。同時(shí),選擇作用下的連鎖不平衡會(huì)造成選擇位點(diǎn)附近的中性位點(diǎn)的基因頻率隨之增加形成長(zhǎng)范圍的單倍型純合。群體遺傳學(xué)中,將這種由選擇作用造成的部分染色體片段的多態(tài)性降低現(xiàn)象稱為選擇性清除。
搭便車效應(yīng)(Hitchhiking Effect):選擇位點(diǎn)周圍的中性位點(diǎn)得益于選擇作用而出現(xiàn)的基因頻率迅速增加的現(xiàn)象,則被通俗地稱為“搭便車”效應(yīng)。
選擇信號(hào)(Selection signature):選擇性掃除和“搭便車”效應(yīng)屬于從不同角度表述的同一群體遺傳學(xué)現(xiàn)象,都是選擇作用在基因組上留下的明顯特征,此特征被稱為選擇信號(hào)。
基因的隨機(jī)漂移或遺傳漂變(random genetic drift):由某一代基因庫(kù)中抽樣形成下一代個(gè)體的配子時(shí)發(fā)生機(jī)誤,這種機(jī)誤引起基因頻率的變化稱之為基因的隨機(jī)漂移或遺傳漂變。換句話說,就是利用隨機(jī)抽樣的辦法建立小群體時(shí),由于抽樣誤差引起基因頻率隨機(jī)波動(dòng)的現(xiàn)象。
等位基因頻率(Alleles frequency):在一個(gè)群體中,某類等位基因占該基因位點(diǎn)上全部等位基因數(shù)的比率。
基因型頻率(Genotype Frequence):群體中某一基因型個(gè)體的數(shù)目占群體總個(gè)數(shù)的比例。可以反映某一基因型個(gè)體在群體中的相對(duì)數(shù)量。
遺傳平衡定律或哈迪.溫伯格定律(Hardy-Weinburg):在隨機(jī)交配下的孟德爾群體中,如沒有替他因素(基因突變、遷移和選擇)的干擾,群體的基因頻率和基因型頻率將逐代保持不變。
連鎖平衡(Linkage equilibrium):兩個(gè)基因座的等位基因組合的頻率等于組成組合的等位基因各自頻率的乘積,不存在優(yōu)勢(shì)組合,稱為連鎖平衡。
連鎖不平衡(Linkage Disequilibrium):相鄰位點(diǎn)之間的非隨機(jī)關(guān)聯(lián),當(dāng)一個(gè)位點(diǎn)上的某一等位基因與另一位點(diǎn)上的等位基因共同出現(xiàn)的概率大于隨機(jī)組合的假設(shè),則這兩個(gè)位點(diǎn)之間存在連鎖不平衡。
適合度(fitness):指一個(gè)個(gè)體能夠生存并將其基因傳給下一代的能力,可用相同環(huán)境中不同個(gè)體的相對(duì)生育率來衡量(即在選擇中,某一基因型個(gè)體在下一代平均保留后代數(shù)的比率)。
Q-Q plot 全稱是quantile-quantile plot,也就是分位圖,是一種通過比較兩個(gè)概率分布的分位數(shù)從而實(shí)現(xiàn)對(duì)兩個(gè)概率分布進(jìn)行比較的概率圖方法。原因是,如果兩個(gè)概率分布相同,那么它們的分位數(shù)也應(yīng)該相同或者重疊在同一條直線上。
在GWAS 分析中,當(dāng)我們通過曼哈頓圖看到某些SNP 和表型性狀(或者疾?。┯兄軓?qiáng)的相關(guān)信號(hào)(比如,p-value < 10^-6 甚至10^-8)時(shí),依然不能直接認(rèn)為這些位點(diǎn)就與表型顯著相關(guān)的。這是因?yàn)榛蚪M上基因位點(diǎn)的突變通常有兩個(gè)來源:第一是自然選擇(Selection),這里所說的自然選擇不僅指達(dá)爾文在《進(jìn)化論》中所描述的物競(jìng)天擇,還指所有對(duì)物種適應(yīng)性有影響作用的“力量”,比如高輻射環(huán)境、疾病、病毒等,這也是我們?cè)贕WAS 研究中真正關(guān)心的突變;
第二是遺傳漂變(genetics drift),它是一種比較隨機(jī)的基因組突變而且數(shù)量也不少,雖然也是物種演化的一種重要力量,但是由于它的突變都比較隨機(jī),目前認(rèn)為它與環(huán)境的變遷沒有必然聯(lián)系,但也會(huì)在某些時(shí)候,有些隨機(jī)的突變帶來了生存優(yōu)勢(shì),便會(huì)在種群中顯示出它的作用。但絕大多數(shù)情況下,對(duì)于已經(jīng)在群體中穩(wěn)定存在的性狀而言,并不認(rèn)為它們有明顯的作用,所以GWAS 研究是不關(guān)心這一類突變的,要把它們?nèi)颗懦?。如果發(fā)現(xiàn)自己得到的結(jié)果全部是這樣的變異的話,那么,應(yīng)該重新考慮一下如何重新設(shè)計(jì)這個(gè)分析,包括是否應(yīng)該增加樣本量以及想辦法排除技術(shù)錯(cuò)誤以及干擾因素等方面,或者也可能它們之間就是沒有關(guān)系。
在GWAS 分析里面,QQ-plot 的縱軸是SNP 位點(diǎn)的p-value 值(這是實(shí)際得到的結(jié)果,observed),與曼哈頓圖一樣也是表示為-log10(p-value);橫軸是則是均勻分布的概率值(這是Expecte 的結(jié)果),同樣也是換算為-log10。橫軸的這個(gè)概率值是如何計(jì)算的呢?實(shí)際上,它就是均勻分布的分位數(shù)。分位數(shù)的個(gè)數(shù)與GWAS 研究的SNP 位點(diǎn)數(shù)是一一對(duì)應(yīng)的。比如我們研究中使用了5 百萬個(gè)基因位點(diǎn), 那么分位數(shù)的個(gè)數(shù)也是5 百萬個(gè), 從1/5000000,2/5000000,3/5000000,...一直往下排直到5000000/5000000,當(dāng)然都是轉(zhuǎn)換為-log10,然后與GWAS p-value 一起作圖而成。
得到QQ plot 之后,如果通過它來協(xié)作判斷我們的GWAS 結(jié)果到底是好還是壞呢?
判斷的秘密就在橫軸為什么要用均勻分布而不是選擇其它分布上。這是因?yàn)榫鶆蚍植记『每梢杂脕斫泼枋龌蚪M上的隨機(jī)漂變現(xiàn)象。如果表型性狀并非真的受自然選擇所左右,那么你應(yīng)該會(huì)看到GWAS p-value 的分布和均勻分布的結(jié)果將集中在一條直線上,如果不是那么就應(yīng)該能夠看到相互分離的情況,特別是p-value 越低的時(shí)候分離程度就越高,QQ-plot 會(huì)翹起來(這是因?yàn)镚WAS 的零假設(shè)就是與隨機(jī)突變相比沒有區(qū)別)。
而且,我們知道基因組上的隨機(jī)漂變是一定存在的,所以一定會(huì)有位點(diǎn)與隨機(jī)漂變相關(guān),特別是是在p-value 比較大的位點(diǎn)看起來就應(yīng)該和隨機(jī)漂變重疊,這就表現(xiàn)在QQ-plot 的前半部分里。這些位點(diǎn)的分布會(huì)和均勻分布重疊!而且,比較好的結(jié)果是,當(dāng)p-value < 10^-3 時(shí),GWAS 結(jié)果開始與均勻分布出現(xiàn)快速分離——也就是說,自然選擇的力量明顯地顯示出來了,使得結(jié)果在群體中快速擺脫隨機(jī)性,最后看到一個(gè)高高翹起的QQ-plot。這時(shí)基本就可以斷定,我們所研究的表型和基因型之間是存在著顯著相關(guān)的自然選擇作用的。

參考:http://www.360doc.com/content/18/0208/11/19913717_728563847.shtml

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容