1、基本統(tǒng)計(jì)學(xué)概念
假設(shè)檢驗(yàn)
? 零假設(shè)(H0):即原假設(shè)
? 備擇假設(shè)(H1):與零假設(shè)對(duì)立的假設(shè)
? 計(jì)算零假設(shè)(H0)成立的概率
? 如果H0成立的概率很低(e.g. 5% or 1%),則拒絕原假設(shè),接受備擇假設(shè)
? 否則接受原假設(shè)
image.png
兩類錯(cuò)誤與統(tǒng)計(jì)功效
? I類錯(cuò)誤(Type I error): 拒絕真實(shí)的H0, 即假陽(yáng)性, 概率α為顯著性水平;
? II類錯(cuò)誤(Type II error): 接受錯(cuò)誤的H0, 即假陰性, 概率為β;
? 功效(Power): 拒絕錯(cuò)誤H0的概率, (1-β)
image.png
2、Case/Control關(guān)聯(lián)分析
病例對(duì)照分析
? Case/control,一般可以用Pearson’s X2檢驗(yàn)來(lái)分析
? 等位基因關(guān)聯(lián),檢測(cè)性狀與等位基因的關(guān)聯(lián)性
? 假設(shè)一個(gè)標(biāo)記有兩種等位基因,分別為1和2,令Nca為病例,Nco為對(duì)照,列聯(lián)表如下
image.png
? H0:列變量與行變量無(wú)關(guān),即該位點(diǎn)等位基因的分布與病例-對(duì)照無(wú)關(guān);
? H1:列變量與行變量有關(guān),即該位點(diǎn)等位基因的分布與病例-對(duì)照有關(guān)。
卡方檢驗(yàn)
image.png
當(dāng)H0成立時(shí),總體趨向卡方分布,且自由度為(r ? 1)(c ? 1) = (2 ? 1)(2 ? 1) = 1
Note:卡方檢驗(yàn)就是統(tǒng)計(jì)樣本的實(shí)際觀測(cè)值與理論推斷值之間的偏離程度,實(shí)際觀測(cè)值與理論推斷值之間的偏離程度就決定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趨于符合,若兩個(gè)值完全相等時(shí),卡方值就為0,表明理論值完全符合??ǚ綑z驗(yàn)針對(duì)分類變量。
卡方檢驗(yàn)計(jì)算示例
image.png
邏輯回歸(可以加入群體結(jié)構(gòu)協(xié)變量)
? 令Yi為第i個(gè)個(gè)體的質(zhì)量性狀的表型值Yi = {0,1}; 0為其中一種表現(xiàn)型(controls),1為另一種表現(xiàn)型(cases);
? Yi = 0; controls; Yi = 1; cases.
? 令Xi為第i個(gè)個(gè)體某個(gè)位點(diǎn)的基因型,Xi = {0,1,2}; 0為其中一種純合基因型(TT),1
為雜和基因型(如GT),2為另一種純合基因型(如GG);
? Xi = 0; TT; Xi = 1; GT; Xi = 2; GG.
? 邏輯回歸:
? pi = E(Yi|Xi);在Xi條件下Yi的期望;
? logit(pi) = loge[pi /(1- pi) ]
? logit(pi) ~ β0 + β1Xi
? 檢驗(yàn)β1與0是否存在顯著的差異,即為關(guān)聯(lián)p值
? 增加協(xié)變量(性別,群體結(jié)構(gòu)矩陣,環(huán)境因素等):
? pi = E(Yi | Xi,Ci, Di,…)
? logit(pi)~β0 + β1Xi + β2Ci + β3Di +…
質(zhì)量性狀-卡方檢驗(yàn)-邏輯回歸結(jié)果比較
image.png
3、復(fù)雜性狀使用簡(jiǎn)單統(tǒng)計(jì)方法是否可行?
數(shù)量性狀與QTL
? 數(shù)量性狀(quantitative characters):是指在一個(gè)群體內(nèi)的各個(gè)體間表現(xiàn)
為連續(xù)變異的性狀,遺傳上一般由多個(gè)微效基因控制
? 數(shù)量性狀基因座(quantitative trait locus,QTL):它指的是控制數(shù)量性
狀的基因在基因組中的位置
? QTL定位:發(fā)掘影響數(shù)量性狀變異的遺傳位置的過(guò)程
單位點(diǎn)簡(jiǎn)單回歸模型
image.png
結(jié)論:
1)簡(jiǎn)單的統(tǒng)計(jì)方法可以用于GWAS;
2)但是方法本身考慮的影響因素比較少,因而假陽(yáng)性比較高;
3)在標(biāo)記量比較少,針對(duì)特定區(qū)間的或個(gè)別位點(diǎn)進(jìn)行分析時(shí),可以使
用t測(cè)驗(yàn)、相關(guān)性分析等簡(jiǎn)單的方法進(jìn)行。
4、復(fù)雜統(tǒng)計(jì)模型簡(jiǎn)介
主要為 GLM 和 MLM (不做詳細(xì)介紹)






