保證關(guān)聯(lián)分析成功的關(guān)鍵
? 精確可靠的表型
? 表型重復(fù)方差最小化,盡量減少非系統(tǒng)測量誤差;
? 表型的遺傳力最大化。
? 假陽性最低化:盡可能減少位點(diǎn)間的非連鎖相關(guān)的影響
? GWAS 實(shí)際上反應(yīng)的是表型與各個座位的等位基因狀態(tài)的相關(guān)性,所以位點(diǎn)間的非連鎖相關(guān)會導(dǎo)致假陽性,位點(diǎn)間的非連鎖相關(guān)的主要來源包括群體結(jié)構(gòu)(材料的亞群分化)和親緣關(guān)系(材料間的共祖關(guān)系)。
? 標(biāo)記密度足夠,理論上 GWAS 最低飽和標(biāo)記密度=基因組大小/LD 衰減距離,實(shí)際上越密越好。
關(guān)聯(lián)分析模型
? 一般線性模型 (GLM, general linear model):只有固定效應(yīng),沒有隨機(jī)效應(yīng)。
? 混合線性模型 (MLM, mixed linear model)
? 在一般線性模型的基礎(chǔ)上增加了隨機(jī)效應(yīng);
? emma、 CMLM、 FarmCPU、 Blink、 super、 P3D、 fast-LMM 等均是混合線性模型的改進(jìn);
? 通過降維提升計算速度,同時不影響功效(power)。

兩類錯誤與統(tǒng)計功效
- 假陽性:應(yīng)該不顯著,但檢測結(jié)果顯著;
- 假陰性:應(yīng)該顯著,但檢測結(jié)果不顯著;
- 統(tǒng)計效力(power):檢測到的QTN的數(shù)目占影響某性狀的總QTN數(shù)目的比例;
- 一類錯誤(Type I error):假陽性標(biāo)記占錯誤總標(biāo)記數(shù)的比例。
各模型評價結(jié)果

Xiao et al., Mol. Plant, 2017
- 根據(jù)群體結(jié)構(gòu)評估的情況,選用相應(yīng)的模型,但在實(shí)際操作中一般使用多種模型(GLM /MLM /EMMAX /FaST-LMM) 同時分析,根據(jù)結(jié)果進(jìn)行取舍;
- 選擇:GLM/MLM/CMLM為基礎(chǔ) (TASSEL/GAPIT),與EMMAX、 Fast-LMM相互比較,其他作為補(bǔ)充,當(dāng)性狀與群體結(jié)構(gòu)相關(guān)時,可以考慮使用FarmCPU;
- 顯著性閾值確定(Bonferroni correction)
Bonferroni correction = 顯著性水平(0.01/0.05)/檢驗(yàn)次數(shù)(number of detected markers)
在實(shí)際情況中,當(dāng)顯著水平為0.01和0.05時,會檢測到少量甚至沒有顯著位點(diǎn),因此也會將顯著水平提高到1,要根據(jù)實(shí)際情況進(jìn)行調(diào)整。
引用轉(zhuǎn)載請注明出處,如有錯誤敬請指出。