GWAS生物學(xué)相關(guān)名詞解釋

  1. 背景基因

與所研究的表現(xiàn)型直接有關(guān)的基因以外的全部基因的總稱

  1. LD :

當(dāng)位于某一座位的特定等位基因與另一座位的某一等位基因同時出現(xiàn)的概率大于群體中因隨機(jī)分布的兩個等位基因同時出現(xiàn)的概率時,就稱這兩個座位處于連鎖不平衡狀態(tài)(linkage disequilibrium)

LD 衰減距離相關(guān)解釋(http://www.itdecent.cn/p/a36bd4145ef7

單體型塊圖(LD bolck)(https://www.omicshare.com/forum/thread-1201-1-1.html)

  1. 質(zhì)量性狀與數(shù)量性狀

質(zhì)量性狀指相對性狀的變異呈不連續(xù)性,呈現(xiàn)質(zhì)的中斷性變化的性狀。由1對或少數(shù)幾對主基因控制。如雞羽的蘆花斑紋和非蘆花斑紋、角的有無、毛色、血型等都屬于質(zhì)量性狀。

數(shù)量性狀指相對性狀的變異呈連續(xù)性,個體之間的差異不明顯,很難明確分組。受微效多基因控制,控制數(shù)量性狀的基因稱為數(shù)量性狀位點(quantitative trait loci, QTLs).在QTLs中, 基因的效應(yīng)也有大有小。其中, 效應(yīng)較大的稱為主效QTL, 效應(yīng)較小的稱為微效QTL(或微效多基因)。動植物的許多重要經(jīng)濟(jì)性狀都是數(shù)量性狀,如作物的產(chǎn)量、成熟期,奶牛的泌乳量,棉花的纖維長度、細(xì)度等等。

但是,生物的許多性狀并不是絕對的質(zhì)量性狀或數(shù)量性狀, 多數(shù)表型介于兩者之間,同時受到主基因和數(shù)量性狀位點(QTLs)的控制。水稻包穗性狀就是受到主基因和數(shù)量性狀位點的共同控制。

  1. 關(guān)聯(lián)分析和連鎖分析

關(guān)聯(lián)分析是以連鎖不平衡(linkage disequilibrium, LD)為基礎(chǔ)的。連鎖不平衡是不同基因座位上等位基因的非隨機(jī)組合。

圖示

1、連鎖采用家系樣本;關(guān)聯(lián)采用散發(fā)樣本
2、連鎖應(yīng)用LINKAGE核心IBD算法做計算;關(guān)聯(lián)用卡方檢驗計算2組,找到相關(guān)行
3、連鎖一般找到的是某個區(qū)域;關(guān)聯(lián)找到的是某個點
4、連鎖結(jié)果相對準(zhǔn)確,假陽性小,但精細(xì)定位很困難,主要原因是家系問題。關(guān)聯(lián)相對粗糙,假陽性很高,但可以直接定到基因位點

這里還有一個對于在人類疾病中的相關(guān)解釋(https://huans.github.io/2017/12/18/QTL/

  1. BLUP

最佳線性無偏預(yù)測(best linear unbiased prediction, 簡稱BLUP),是統(tǒng)計學(xué)上用于線性混合模型對隨機(jī)效應(yīng)進(jìn)行預(yù)測的一種方法。隨機(jī)效應(yīng)的最佳線性無偏預(yù)測(BLUP)等同于固定效應(yīng)的最佳線性無偏估計(best linear unbiased estimates, BLUE)

BLUP(best linear unbiased prediction)在育種中是指根據(jù)多次觀測的結(jié)果,使用線性無偏估計的方法,去掉環(huán)境差異的影響,估計出由遺傳因子決定部分,估計出的值我們常稱為育種值(Estimated breeding value,EBVs),相比于均值,EBVs去除了環(huán)境差異導(dǎo)致的差異,所以更能代表該性狀。但如果我們需要考慮基因型與環(huán)境互作時(G by E),則應(yīng)該用多年多點觀測的結(jié)果分別分析然后綜合比較。

其他相關(guān)解釋
關(guān)于BLUP方法的幾點說明
動物育種核心算法BLUP介紹(公式版)

  1. 基因型分型

基因型分型(英語:genotyping)是一個通過生物檢定法檢測某一個體的DNA序列,并對比參照其他個體的基因型或序列的過程,可用于顯示該個體等位基因從其父母遺傳而來的情況. 通常,基因型分型利用DNA序列定義群體信息,而不涉及定義該個體的基因。

  1. 遺傳力

遺傳力又稱遺傳率,指遺傳方差在總方差(表型方差)中所占的比值,可以作為雜種后代進(jìn)行選擇的一個指標(biāo)。遺傳力分為廣義遺傳力和狹義遺傳力。數(shù)量性狀受到環(huán)境因素的影響很大,那么表型的變異可能有遺傳的因素,也有環(huán)境的因素,甚至還有環(huán)境和遺傳相互作用的因素。


性狀影響
例如15℃時基因型AA的植物平均高度為40cm,而基因型Aa型的植物僅有35cm高;但是在30℃時情況就不同了,AA植株的平均高度為55cm,而Aa型植株反長得更高,為60cm。同一種基因型在不同的溫度下表型不同,這一變異是由環(huán)境引起的,所產(chǎn)生的方差稱環(huán)境方差(VE);在同樣的溫度下,不同基因型的高度不同,這一表型變異是遺傳因子所引起的,所產(chǎn)生的方差稱遺傳方差。在任何的溫度下,植物的表型既受到溫度的影響,又受到遺傳因素的影響,這種影響產(chǎn)生的方差稱環(huán)境和遺傳的協(xié)方差。
表型是由遺傳和環(huán)境共同作用的結(jié)果,可以下式表示。
P=G+E

遺傳力
若以方差表示:
對于一個表型的變異究竟是遺傳因子起主要作用還是環(huán)境因子起主要作用呢?為了解答這個問題人們又引入一個概念叫遺傳力(heritability)。遺傳力表明某一性狀受到遺傳控制的程度。它介于0與+1之間,當(dāng)?shù)扔?時表明表型變異完全是由遺傳的因素決定的,當(dāng)?shù)扔?時表型變異由環(huán)境所造成。

  1. REML 方法

限制最大似然 (REML) 方法

  1. 哈迪-溫伯格定律

“哈迪-溫伯格定律”是指在理想狀態(tài)下,各等位基因的頻率在遺傳中是穩(wěn)定不變的,即保持著基因平衡。該定律運用在生物學(xué)、生態(tài)學(xué)、遺傳學(xué)。條件:①種群足夠大;②種群個體間隨機(jī)交配;③沒有突變;④沒有選擇;⑤沒有遷移;⑥沒有遺傳漂變。
例如:當(dāng)?shù)任换蛑挥幸粚Γˋa)時, 設(shè)基因A的頻率為 p,基因a的頻率為q,則A+a=p+q=1,AA+Aa+aa=p2+2pq+q2=1 。哈迪-溫伯格平衡定律(Hardy-Weinberg equilibrium) 對于一個大且隨機(jī)交配的種群,基因頻率和基因型頻率在沒有遷移、突變和選擇的條件下會保持不變。

  1. 協(xié)方差

協(xié)方差(Covariance)在概率論和統(tǒng)計學(xué)中用于衡量兩個變量的總體誤差。而方差是協(xié)方差的一種特殊情況,即當(dāng)兩個變量是相同的情況。
協(xié)方差表示的是兩個變量的總體的誤差,這與只表示一個變量誤差的方差不同。 如果兩個變量的變化趨勢一致,也就是說如果其中一個大于自身的期望值,另外一個也大于自身的期望值,那么兩個變量之間的協(xié)方差就是正值。 如果兩個變量的變化趨勢相反,即其中一個大于自身的期望值,另外一個卻小于自身的期望值,那么兩個變量之間的協(xié)方差就是負(fù)值。

  1. eQTL

首先 QTL 是數(shù)量性狀位點,比如身高是一個數(shù)量性狀,其對應(yīng)的控制基因的位點就是一個數(shù)量性狀位點,而eQTL就是控制數(shù)量性狀表達(dá)位點,即能控制數(shù)量性狀基因(如身高基因)表達(dá)水平高低的那些基因的位點。
數(shù)量性狀基因座:控制數(shù)量性狀的基因在基因組中的位置稱數(shù)量性狀基因座。常利用DNA分子標(biāo)記技術(shù)對這些區(qū)域進(jìn)行定位,與連續(xù)變化的數(shù)量性狀表型有密切關(guān)系

表達(dá)數(shù)量性狀基因座(expression Quantitative Trait Loci,eQTL)是對上述概念的進(jìn)一步深化,它指的是染色體上一些能特定調(diào)控mRNA和蛋白質(zhì)表達(dá)水平的區(qū)域,其mRNA/蛋白質(zhì)的表達(dá)水平量與數(shù)量性狀成比例關(guān)系。eQTL可分為順式作用eQTL和反式作用eQTL,順式作用eQTL就是某個基因的eQTL定位到該基因所在的基因組區(qū)域,表明可能是該基因本身的差別引起的mRNA水平變化;反式作用eQTL是指某個基因的eQTL定位到其他基因組區(qū)域,表明其他基因的差別控制該基因mRNA水平的差異。

eQTL就是把基因表達(dá)作為一種性狀,研究遺傳突變與基因表達(dá)的相關(guān)性: 就好像研究遺傳突變與身高的相關(guān)性一樣。
早年可以通過同時做一個個體的SNP芯片和cDNA芯片, 在全基因組尺度研究突變與表達(dá)的相關(guān)性, 這種研究需要較多個體(例如1000個); 現(xiàn)在隨著深度測序的出現(xiàn),很多人開始用RNA-Seq在較少量個體中研究allele-specific expression,本質(zhì)上就是eQTL。
簡單地說, 遺傳學(xué)研究經(jīng)常發(fā)現(xiàn)一些致病或易感突變, 這些突變怎樣導(dǎo)致表型有時候不太直觀; 所以用某個基因的差異表達(dá)作為過渡: 突變A-->B基因表達(dá)變化-->表型;

  1. 置換檢驗(Permutation test)

https://www.plob.org/article/3176.html

  1. 串聯(lián)重復(fù)序列

串聯(lián)重復(fù)序列是指以相對恒定的短序列為重復(fù)單位,首尾相接, 串聯(lián)連接形成的重復(fù)序列,又稱衛(wèi)星DNA (satellite DNA)。在人類基因組中,串聯(lián)重復(fù)序列約占10%,主要分布在非編碼區(qū), 少數(shù)位于編碼區(qū)。編碼區(qū)中的串聯(lián)重復(fù)序列與功能有關(guān),非編碼區(qū)串聯(lián)重復(fù)序列多分布在間隔DNA或內(nèi)含子,重復(fù)單位短的僅2bp長的可達(dá)數(shù)十堿基對,重復(fù)次數(shù)少則數(shù)次,多則幾百次。重復(fù)序列的重復(fù)次數(shù)不同,是形成DNA長度多態(tài)性的基礎(chǔ)。按重復(fù)序列的長度和序列特征分成大衛(wèi)星DNA、小衛(wèi)星DNA和微衛(wèi)星DNA等主要類型。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容