SAVOLAINEN O, PYHAJARVI T (2007) Genomic diversity in forest trees. Curr Opin Plant Biol 10:162–167. doi: 10.1016/j.pbi.2007.01.011
一般而言,森林樹木在過境,長(zhǎng)壽和馴化的早期階段。由于生成時(shí)間長(zhǎng),中性位點(diǎn)的分子進(jìn)化非常緩慢。通過高序列相似性促進(jìn)密切相關(guān)的針葉樹物種之間的信息傳遞。在核苷酸水平上,相對(duì)于其他植物,樹木具有至多中等水平的變異。重要的是,在許多物種中,基因內(nèi)的連鎖不平衡在不到1000bp內(nèi)下降。與中性進(jìn)化速度緩慢相反,大型樹種群對(duì)自然選擇反應(yīng)迅速。在樹群中檢測(cè)選擇痕跡可能比許多其他物種更容易?;蛐秃捅硇椭g的關(guān)聯(lián)研究被證明是功能基因組學(xué)的有用工具。
引言
森林樹木在許多生態(tài)系統(tǒng)中具有生態(tài)優(yōu)勢(shì)。許多具有經(jīng)濟(jì)重要性,它們的馴化最近才開始。樹木繁殖一般來說很慢,因?yàn)榇蠖鄶?shù)物種的生成時(shí)間很長(zhǎng)。因此,顯然需要找到能夠加速檢測(cè)基因組中功能重要區(qū)域的遺傳和基因組方法。
變異模式的分子群體遺傳學(xué)研究以及產(chǎn)生它們的進(jìn)化力量正在提供對(duì)樹木特殊進(jìn)化特征的見解。群體的遺傳結(jié)構(gòu)定義了如何使用自然變異來檢測(cè)和繪制具有功能重要性的基因組區(qū)域。例如,關(guān)聯(lián)研究的范圍需要根據(jù)種群表型變異和連鎖不平衡程度(LD)進(jìn)行評(píng)估[1,2]。
一些樹種,如胡楊,具有非常小的基因組,大約是擬南芥基因組大小的四倍[3],但針葉樹的基因組大于擬南芥基因組大小的100倍[4]。幾乎完整的Populus序列提供了對(duì)基因組所有區(qū)域的訪問[3]。自從發(fā)表第一個(gè)Pinus taeda cDNA序列[5]以來,廣泛表達(dá)的序列標(biāo)簽(EST)資源也可用于許多其他物種,包括Picea [6]。其他基因組資源正在迅速改善。
本綜述考察了溫帶針葉樹和楊屬中編碼區(qū)的核苷酸多態(tài)性。我們還考慮了不同進(jìn)化因素在塑造這種多樣性方面所起的作用,特別是檢測(cè)選擇的潛力。還討論了功能基因組學(xué)研究的意義。
與群體遺傳相關(guān)的樹木的生活史特征和其他特征
由于自交不親和機(jī)制或嚴(yán)重的早期(和晚期)近交衰退,大多數(shù)樹木主要是異型雜交[7]?;ǚ哿骱头N子流通常在樹木中非常有效[8]。世代時(shí)間很長(zhǎng)。北部針葉樹后期(接近20年)達(dá)到生殖成熟,壽命長(zhǎng)達(dá)數(shù)百年。楊樹可以達(dá)到生殖成熟4-6年[3],但它也可以有很長(zhǎng)的壽命。今天,許多商業(yè)上重要的物種具有大的自然分布區(qū)域;例如蘇格蘭松(Pinus sylvestris),挪威云杉(Picea abies)和落葉松(Larix spp。)覆蓋歐亞大陸。其他樹種,如輻射松(Pinus radiata),具有較小的碎片自然分布。然而,對(duì)化石記錄,葉綠體DNA(cpDNA),線粒體DNA(mtDNA)和同種異體酶的研究表明,冰川周期已引起大多數(shù)溫帶物種的范圍收縮和擴(kuò)張[9,10]。重要的表型特征,如生長(zhǎng)時(shí)間和耐寒性,在許多廣泛分布的樹種中具有環(huán)境梯度的臨界變異[11,12]。與許多作物物種相比,大多數(shù)商業(yè)上重要的森林物種基本上存在于自然種群中,幾乎沒有馴化和人工選擇的痕跡。
樹木基因組的中性進(jìn)化緩慢
在不受選擇影響的核苷酸位點(diǎn)(中性位點(diǎn)),進(jìn)化速率受突變率控制。同義位點(diǎn)的核苷酸取代率提供了突變率的直接估計(jì)。如果我們知道DNA水平上兩個(gè)物種的分歧水平并估計(jì)它們的分歧時(shí)間,我們就可以估算核苷酸替代率。在擬南芥中,同義替代率估計(jì)為1.5x108每個(gè)位點(diǎn)每年[13]。在Populus中,估計(jì)進(jìn)化速率僅為該速率的六分之一[3]。最近對(duì)Pinus化石的仔細(xì)校準(zhǔn)導(dǎo)致估計(jì)值為0.7x108/位點(diǎn)/年,這個(gè)速度非常緩慢[14]。因此,數(shù)千萬年前分化的松樹物種在同義位點(diǎn)的差異可能不到5%。然而,當(dāng)我們將這些替代或突變率轉(zhuǎn)換為每代的比率(即將它們乘以世代時(shí)間估計(jì)值,例如20年)時(shí),它們接近于估計(jì)的許多一年生植物物種的比率。
全基因組對(duì)核苷酸多樣性的影響
在檢查核苷酸多態(tài)性的模式時(shí),我們首先將它們與簡(jiǎn)單模型進(jìn)行對(duì)比,如果需要,然后檢查其他進(jìn)化因子。大多數(shù)植物生物學(xué)家對(duì)自然選擇對(duì)特定基因座的影響特別感興趣,例如,抗病基因座。然而,首先必須檢查那些具有全基因組影響的因子是否可以引起觀察。種群大小或遷移變化的許多影響可能類似于自然選擇產(chǎn)生的多態(tài)性模式。在推斷選擇已經(jīng)運(yùn)行之前,需要注意解釋結(jié)果。
標(biāo)準(zhǔn)中性模型考慮有限群體,其中交配是隨機(jī)的并且沒有種群細(xì)分。所有個(gè)體都有可能存活和繁殖。可以假設(shè)核苷酸位點(diǎn)的同義變體根據(jù)該模型進(jìn)化。該中性模型中的核苷酸多樣性水平受突變率和群體大小的控制。在其他條件相同的情況下,我們期望大群體中的核苷酸多樣性比小群體更多,因?yàn)殡S機(jī)抽樣(遺傳漂變)可以更有效地減少小群體的變異??紤]到我們上面考慮的突變率,大的有效大小,以及其他標(biāo)記基因座上的大量變異的早期發(fā)現(xiàn),我們可以預(yù)期平衡群體中的高水平遺傳多樣性[15]。圖1顯示了樹木和其他植物中沉默核苷酸多樣性估計(jì)的分布([3,16?7]。樹木的多樣性估計(jì)變化很大,但不高于其他植物。這表明許多樹種群可能不處于均衡狀態(tài),并且除當(dāng)前種群大小之外的因素,例如種群大小的歷史變化,可能會(huì)降低全基因組的多樣性。
上述理論還預(yù)測(cè),不同基因座的多態(tài)性水平會(huì)有變異,具體取決于突變率。日本柳杉(Cryptomeria japonica)和落羽杉(Taxodium distichum)之間的差異預(yù)測(cè)了大多數(shù)位點(diǎn)的柳杉(Cryptomeria)內(nèi)的變異水平(圖2a,基于[28]的結(jié)果)?;诜制绲淖兞勘阮A(yù)測(cè)的變量多得多或少得多的基因可能受到其他進(jìn)化因素的影響(見圖2a中帶圓圈的點(diǎn))。
密切相關(guān)的核苷酸位點(diǎn),例如單個(gè)基因內(nèi)的位點(diǎn),預(yù)計(jì)不會(huì)獨(dú)立發(fā)展。兩個(gè)核苷酸位點(diǎn)處的變異頻率之間的統(tǒng)計(jì)相關(guān)性(即連鎖不平衡,LD)在緊密連鎖的位點(diǎn)之間比在相距更遠(yuǎn)的位點(diǎn)之間更大。圖2b顯示了來自歐洲不同地區(qū)的樟子松樹木的2000 bp苯丙氨酸氨裂解酶基因pal1的一組序列的小例子[15]。不同的核苷酸位點(diǎn)至少幾乎彼此獨(dú)立。迄今為止,在火炬松[29],Populus tremula [30]和P. abies [31]的大多數(shù)位點(diǎn)都發(fā)現(xiàn)了這種低LD和快速衰變(1000bp或更快)的模式。這與高度近交種類如擬南芥[32]的情況形成鮮明對(duì)比,其中LD在全球樣本中延伸超過20kb的距離[33],但與玉米中發(fā)現(xiàn)的情況類似[34]。
樹種群具有較大的分布范圍,并且迄今為止,已發(fā)現(xiàn)許多物種在整個(gè)范圍內(nèi)具有相當(dāng)均勻的不同等位基因頻率(比較圖2b中所示的pal1的種群)。在歐洲,大多數(shù)核苷酸多樣性存在于種群內(nèi),并且在樟子松[11]和楊樹[30]的種群之間發(fā)現(xiàn)不到5%,而P. abies在中歐和北歐之間的差異略大[31]。相比之下,在一組中歐擬南芥種群中,17%的變異發(fā)生在種群之間,表明差異更大[35]。
大型長(zhǎng)壽樹種群中非常緩慢的中性過程是樹種群的一個(gè)重要特征[29,36]。在種群規(guī)模變化后,種群達(dá)到突變和遺傳漂變之間的新平衡,其速率受4N(其中N是種群大?。┑目刂?。在達(dá)到新的均衡之前,群體的基因構(gòu)成與均衡期望不同。群體大小的瓶頸首先消除稀有等位基因,而群體擴(kuò)增階段導(dǎo)致具有低頻率變體的核苷酸位點(diǎn)數(shù)量增加。種群規(guī)模變化的這種后果具有全基因組效應(yīng)。例如,P. abies的核基因中過量的稀有變異(以及其他證據(jù))被解釋為古老瓶頸后擴(kuò)張的結(jié)果[31]。
檢測(cè)樹木基因組中的選擇
自然選擇在基因組中留下許多痕跡。然而,檢測(cè)這些信號(hào)并不容易,因?yàn)?strong>許多群體統(tǒng)計(jì)事件可能導(dǎo)致類似的多態(tài)性模式。例如,新的有利等位基因(選擇性清除)的傳播伴隨著所選位點(diǎn)周圍區(qū)域的變異性的減少[33],例如發(fā)現(xiàn)玉米teosinte分支1(tb1)基因[37]。圖2a中的一個(gè)基因座處的可變性降低可能是由于這種選擇性清除。然而,這種減少的多樣性也可能是由于群體統(tǒng)計(jì)偏離標(biāo)準(zhǔn)中性模型。過量的稀有等位基因可以反映新的有利等位基因的傳播,但也可以從群體的擴(kuò)張階段開始。具有中等頻率變體的高頻率核苷酸位點(diǎn)可能是由于選擇維持許多等位基因,例如在自交不親和位點(diǎn),但也可能是由于最近的瓶頸。
自然選擇也可以導(dǎo)致局部不平衡水平的增加,如擬南芥[32,33]中所發(fā)現(xiàn)的,但LD也因重組率的變化或由于種群結(jié)構(gòu)而變化。在當(dāng)?shù)貤l件下群體之間的差異選擇可以產(chǎn)生高分化,但這也可以由群體的分離引起。目前,檢測(cè)基因座選擇效果的最佳方法是證明其多態(tài)性模式與全基因組多態(tài)性有顯著差異[38]。正在嘗試使用人類群體[39],玉米[40]和擬南芥[41]的非常廣泛的數(shù)據(jù)集。這些分析需要樹中很少可用的多位數(shù)數(shù)據(jù)集。
我們編制了一份關(guān)于樹木中個(gè)別基因座選擇的報(bào)告清單(表1)。在所研究的基因座中,據(jù)報(bào)道有15%在某種選擇下,而在擬南芥中,38%的基因報(bào)道了選擇[38]。在導(dǎo)致這種差異的許多可能原因中,由于群體統(tǒng)計(jì)學(xué)的選擇的明顯模式在森林樹木的大型隨機(jī)交配種群中可能不如在其他物種中。一般的選擇機(jī)制尚不清楚。在其他位點(diǎn)的低分化背景下,楊樹(Populus tremula)PhyB2基因座的臨床變異模式可能與生長(zhǎng)的時(shí)間有關(guān)[42]。不同基因可能在不同物種中控制相似的性狀:樟子松中PhyB的同源物沒有顯示出臨床變異的證據(jù)[11]。
雖然樹木的選擇分子痕跡仍然知之甚少,但對(duì)數(shù)量性狀變異的研究表明,選擇在大樹種群中可以高效。例如,許多北歐的樹木種群(例如柳樹,樺樹,云杉和松樹)已經(jīng)進(jìn)化出基因型,其生長(zhǎng)在很長(zhǎng)的一天中被捕獲[43]。在幾千年前的北部地區(qū)冰后重新定殖期間,這種適應(yīng)當(dāng)?shù)厍闆r的生態(tài)型必定會(huì)變得頻繁。與中性進(jìn)化的緩慢速率相比,響應(yīng)自然選擇的進(jìn)化非常迅速。
當(dāng)核苷酸多態(tài)性可以與表型變異相關(guān)時(shí),可以更多地了解選擇。大型,隨機(jī)交配,低LD樹種群非常適合于關(guān)聯(lián)遺傳研究[1,2]。最近已經(jīng)描述了與桉樹和火炬松木材質(zhì)量相關(guān)的第一例遺傳多態(tài)性[44,45]。序列研究有助于在基因組中找到有趣的區(qū)域,與表型的相關(guān)性可能有助于我們理解(至少是當(dāng)前的)選擇模式。
結(jié)論
自然變異的前景長(zhǎng)壽命物種的中性基因組進(jìn)化得非常緩慢,與短壽命植物相比,大群體以較慢的速度達(dá)到平衡。因此,長(zhǎng)壽樹的基因組長(zhǎng)時(shí)間保留了群體事件的后果。相反,自然選擇可以對(duì)大樹種群產(chǎn)生非常快速的影響。在種群和低LD之間具有相當(dāng)?shù)偷钠骄只臉浞N中,可能比具有更復(fù)雜的種群歷史和結(jié)構(gòu)的物種更容易檢測(cè)自然選擇的影響。
樹種群基因組學(xué)的詳細(xì)研究處于早期階段。 增加基因組資源和跨多個(gè)種群和物種的更多樣本將允許更好地理解全基因組模式,以尋找由選擇引起的模式。 對(duì)序列變異的研究,結(jié)合自然表型變異的研究,將有助于解剖樹種適應(yīng)的遺傳學(xué)。