9.1 GWAS:關(guān)聯(lián)分析

保證關(guān)聯(lián)分析成功的關(guān)鍵
? 精確可靠的表型
? 表型重復(fù)方差最小化,盡量減少非系統(tǒng)測量誤差;
? 表型的遺傳力最大化。
? 假陽性最低化:盡可能減少位點(diǎn)間的非連鎖相關(guān)的影響
? GWAS 實(shí)際上反應(yīng)的是表型與各個座位的等位基因狀態(tài)的相關(guān)性,所以位點(diǎn)間的非連鎖相關(guān)會導(dǎo)致假陽性,位點(diǎn)間的非連鎖相關(guān)的主要來源包括群體結(jié)構(gòu)(材料的亞群分化)和親緣關(guān)系(材料間的共祖關(guān)系)。
? 標(biāo)記密度足夠,理論上 GWAS 最低飽和標(biāo)記密度=基因組大小/LD 衰減距離,實(shí)際上越密越好。

關(guān)聯(lián)分析模型

? 一般線性模型 (GLM, general linear model):只有固定效應(yīng),沒有隨機(jī)效應(yīng)。
? 混合線性模型 (MLM, mixed linear model)
? 在一般線性模型的基礎(chǔ)上增加了隨機(jī)效應(yīng);
? emma、 CMLM、 FarmCPU、 Blink、 super、 P3D、 fast-LMM 等均是混合線性模型的改進(jìn);
? 通過降維提升計算速度,同時不影響功效(power)。


兩類錯誤與統(tǒng)計功效

  • 假陽性:應(yīng)該不顯著,但檢測結(jié)果顯著;
  • 假陰性:應(yīng)該顯著,但檢測結(jié)果不顯著;
  • 統(tǒng)計效力(power):檢測到的QTN的數(shù)目占影響某性狀的總QTN數(shù)目的比例;
  • 一類錯誤(Type I error):假陽性標(biāo)記占錯誤總標(biāo)記數(shù)的比例。

各模型評價結(jié)果

Xiao et al., Mol. Plant, 2017

  • 根據(jù)群體結(jié)構(gòu)評估的情況,選用相應(yīng)的模型,但在實(shí)際操作中一般使用多種模型(GLM /MLM /EMMAX /FaST-LMM) 同時分析,根據(jù)結(jié)果進(jìn)行取舍;
  • 選擇:GLM/MLM/CMLM為基礎(chǔ) (TASSEL/GAPIT),與EMMAX、 Fast-LMM相互比較,其他作為補(bǔ)充,當(dāng)性狀與群體結(jié)構(gòu)相關(guān)時,可以考慮使用FarmCPU;
  • 顯著性閾值確定(Bonferroni correction)
    Bonferroni correction = 顯著性水平(0.01/0.05)/檢驗(yàn)次數(shù)(number of detected markers)
    在實(shí)際情況中,當(dāng)顯著水平為0.01和0.05時,會檢測到少量甚至沒有顯著位點(diǎn),因此也會將顯著水平提高到1,要根據(jù)實(shí)際情況進(jìn)行調(diào)整。

引用轉(zhuǎn)載請注明出處,如有錯誤敬請指出。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容