計(jì)算成對(duì)的Fst值后的無(wú)偏估計(jì)-di統(tǒng)計(jì)量(di statistic)
2010年,Joshua M. Akey在文章“Tracking footprints of artificial selection in the dog genome | PNAS”中提出通過(guò)簡(jiǎn)單的匯總統(tǒng)計(jì)來(lái)測(cè)量每個(gè)品種等位基因頻率的位點(diǎn)特異性差異

1.首先計(jì)算出每個(gè)SNP位點(diǎn)的Fst值
2.對(duì)每個(gè)SNP位點(diǎn)的Fst值進(jìn)行計(jì)算劃分窗口的di統(tǒng)計(jì)量。
-
計(jì)算每個(gè)SNP的di統(tǒng)計(jì)量1665571179461.png
,其中1665571112522.png
和1665571135568.png
表示從所有21,114個(gè)SNP計(jì)算出的品種i和j之間的FST的期望值和標(biāo)準(zhǔn)差。 對(duì)于每個(gè)品種,在非重疊1 mb窗口的snp上取di平均值。每個(gè)窗口的平均snp數(shù)為9.5,snp數(shù)小于4個(gè)的窗口被丟棄。
在R中使用“l(fā)m”函數(shù)進(jìn)行標(biāo)準(zhǔn)線性回歸,以調(diào)整SNP標(biāo)記數(shù)量和平均雜合度的di的窗口特異性估計(jì)值,并發(fā)現(xiàn)它對(duì)結(jié)果沒(méi)有顯著影響(P >0.05)。
文獻(xiàn):Genomic Signatures Reveal New Evidences for Selection of Important Traits in Domestic Cattle | Molecular Biology and Evolution | Oxford Academic (oup.com)
根據(jù)對(duì)成對(duì)FST的無(wú)偏估計(jì),即di,如前所述,測(cè)量了每個(gè)品種等位基因頻率的位點(diǎn)特異性差異(Akey et al. 2010)簡(jiǎn)而言之,對(duì)于581,820個(gè)SNP中的每一個(gè),我們計(jì)算了品種i和j之間FST的預(yù)期值和SD。對(duì)于每個(gè)品種,在50個(gè)SNP的非重疊窗口中包含的SNP上對(duì)di進(jìn)行了平均。牛的基因組中共有11,651個(gè)窗口。下游分析使用了平均di得分最高的前1%(117)或5%(583)區(qū)域。
參考:[1] Tracking footprints of artificial selection in the dog genome | PNAS
[2] Genomic Signatures Reveal New Evidences for Selection of Important Traits in Domestic Cattle | Molecular Biology and Evolution | Oxford Academic (oup.com)
[3] Genome-wide scan reveals genetic divergence and diverse adaptive selection in Chinese local cattle | BMC Genomics | Full Text (biomedcentral.com)


