Nature Genetics:水稻泛基因組文章繼續(xù)解讀
原文標題: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice
原文地址: https://www.nature.com/articles/s41588-018-0041-z
今天看的部分是【Identification of functionally diverse alleles】,也就是找到功能變化等位基因。
文章提到,有了深度測序組裝的contig,就能更加精細的找到多種農(nóng)藝性狀相關(guān)的數(shù)量性狀核苷酸(quantitative trait nucleotides, QTNs),還能追蹤重要功能等位基因的馴化起源。為了證明這一點,作者選擇了五個比較重要的QTL, Hd3a, COLD1, GW6a, TAC1, Sd1, 這些基因參與花期,耐冷,粒重,抽穗角度和株高。

野生稻(O. rufipogon) 中基本由這些基因的多態(tài)位點,但是由于founder effect,栽培稻中這些基因的多態(tài)位點的分布就比較有趣了。下面作者就開始對這種是看似意外也不太意外的分布進行了解釋。
- TAC1: 所有野生稻基本上都是T, 而所有的粳稻里都是C(突變方向是T->C),這就是導致粳稻的抽穗角度比較小,這種株型能夠非常適合密植,并且能夠比較地接受光。因此這種突變就會人為保留下來。
- sd1: 是一個株高相關(guān)基因,野生稻基本都是G,而粳稻基本都是A,這種突變會倒是株高降低。這種突變是綠色革命時被人為保留。
除了這些已知的突變類型,其實還是有大量的變異值得研究。作者后面就開始關(guān)注發(fā)生在基因編碼區(qū)的變異,并且嘗試預測這種變異會帶來的影響。根據(jù)泛基因組編碼變異數(shù)據(jù)集,每個基因平均包括10個錯義SNP位點和6個較大效應的多態(tài)位點,那么組合數(shù)就很多了。比如說在waxy里面,從7個具有代表性的單倍型中就找到了3個錯義SNP。在Hd1的7個單倍型中找到了22個錯義SNP,7個indel

作者還分析了這些突變位點在38個基因家族里全局性分布,不出乎意外的就是控制基本生物學過程的基因變異小于植物免疫相關(guān)的基因。
今日得到
- 拿到那么多突變怎么辦,先找?guī)讉€重要基因分析
- 隨后按照基因組家族分布,比較不同生物學過程下的變異情況。
- 問題來了,如何預測潛在突變呢?