LD(連鎖不平衡):計(jì)算使用plink,
FST(遺傳分化指數(shù)):計(jì)算使用vcftools,可視化分為箱線圖和散點(diǎn)圖,單組比較使用在染色體上的散點(diǎn)圖,多組比較使用箱線圖。
FST的原理,計(jì)算方法,可視化的方法 http://www.itdecent.cn/p/bb0beec0ed63
haploPS和XP-EHH
平均測(cè)序深度:
等位基因頻率:
vcftools使用說明:1. https://www.dazhuanlan.com/2020/03/04/5e5f850672ddf/
FST計(jì)算方法
Fst值的取值范圍是[0,1],最大值為1表明兩個(gè)群體完全分化,最小值為0表明群體間無分化。
實(shí)際使用FST<0--0.05,表示群體分化很??;0.05--0.15,中等程度的分化;0.15--0.25,較大的分化;0.25以上,分化很大。
其實(shí)Fst分析就是看兩個(gè)群體之間分化程度的一種方法,F(xiàn)st值越大(越接近1)表明兩個(gè)群體間分化程度越高,親緣關(guān)系越遠(yuǎn);Fst值越?。ㄔ浇咏?)表明群體間分化程度越低,親緣關(guān)系越近。
分為按照SNP單點(diǎn)計(jì)算和滑動(dòng)窗口模式計(jì)算,一般使用的是滑動(dòng)窗模式
####### SNP單點(diǎn)計(jì)算
vcftools --vcf sample.vcf --weir-fst-pop population_1.txt --weir-fst-pop population_2.txt --out sample_1_2
滑動(dòng)窗口模式計(jì)算
vcftools --vcf test.vcf --weir-fst-pop population_1.txt --weir-fst-pop population_2.txt --out P_1_2 --fst-window-size 500000 --fst-window-step 50000
參數(shù)說明:
--vcf 輸入vcf文件
--weir-fst-pop 輸入群體的群體ID名,該文件必須是txt格式,每個(gè)ID占一行。
--fst-window-size 500000 --fst-window-step 50000 ,這里窗口設(shè)置為500kb,步長(zhǎng)設(shè)置為50kb。根據(jù)情況調(diào)整窗口大小。
計(jì)算haploPS、XP-EHH、 Fst,正向選擇分析方法尋找性狀相關(guān)的位點(diǎn)(拿幾個(gè)群體的重測(cè)序數(shù)據(jù),輕松發(fā)核心中文或者<3的SCIE)
π的計(jì)算
π,核苷酸多樣性,越大說明核苷酸多樣性越高,越低說明兩個(gè)座位DNA序列差異越小。
vcftools
LD-blockde 計(jì)算
計(jì)算和可視化,參考
分析方法 參考文獻(xiàn):中國(guó)農(nóng)業(yè)科學(xué) scientific reports
找到重測(cè)序的數(shù)據(jù),基因分型,找到單倍型,call SNP,過濾,注釋snp,可視化,分別計(jì)算haploPS,XP-EHH,Fst.求交集,公共基因進(jìn)行注釋,富集分析。
eQTL (轉(zhuǎn)錄組+snp):Matrix eQTL R包 http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/runit.html#inst
http://www.itdecent.cn/p/6e6d54d7483e
群體結(jié)構(gòu)圖形——structure堆疊圖 http://www.itdecent.cn/p/c7a4fb935e42
https://www.genedenovo.com/news/364.html
群體遺傳學(xué)親緣關(guān)系分析 http://www.itdecent.cn/p/2677dc3b1383
群體結(jié)構(gòu)PCA http://www.itdecent.cn/p/c99de8e5571a
從GWAS摘要統(tǒng)計(jì)信息估算遺傳力和遺傳相關(guān)性ldsc LDSC github
vcftools --vcf F2_3.vcf --plink --out F2_3 #把vcf格式轉(zhuǎn)為plink格式