GenAlex
GenAlex下載地址
GENALEX軟件是Peakall和Smouse研究出的一種在 Microsoft Excel程序中運行的跨操作系統(tǒng)平臺的居群遺傳分析軟件包,它可以對共顯性數(shù)據(jù)、單倍體數(shù)據(jù)和二元數(shù)據(jù)進行分析。GENALEX還提供了一系列基于頻率的分析。例如GENALEX可進行F統(tǒng)計檢驗、Nei’s遺傳距離和地理距離的同一性檢驗以及偏性分布的檢驗?;诰嚯x的計算如 AMOVA分析、相關(guān)性PCA分析、Mantel檢驗等。該軟件包還提供了 20多種不同的圖表總結(jié)數(shù)據(jù)已經(jīng)輔助檢測。除此之外,序列信息和基因型數(shù)據(jù)可以方便地在相關(guān)軟件中轉(zhuǎn)化格式(李欣,2008)。
1. 軟件初步了解
相關(guān)文獻引用一萬七千多,666,下載GenAlEx 6.503 版本,This version offers access to all GenAlEx options via the Excel Ribbon, while at same time remaining backwards compatible with previous Windows versions of Excel.
genalex為excel擴展宏插件,直接在excel里即可運行。并直接讀取excel文件,將結(jié)果生成新的表格。關(guān)于在數(shù)據(jù)的輸入格式參考 quick start 文檔, 前三行為數(shù)據(jù)相關(guān)信息,包括位點數(shù),樣本數(shù),種群數(shù),每個種群的樣本數(shù)等

熒光ssr的結(jié)果為一下形式,除此以外,軟件也可使用其他類型數(shù)據(jù),比如,repeat 的 次數(shù).

2. 軟件功能與參數(shù)
2.1 Parameters menu
從數(shù)據(jù)中識別參數(shù)值,包括,位點數(shù),種群數(shù)等并自動插入到第一行,就不需要在第一行手動輸入這些參數(shù)值了
2.2. Data menu
對數(shù)據(jù)進行編輯處理,根據(jù)樣本 種群 id 進行排序等,根據(jù)種群名稱提取此種群樣本并形成新sheet,其他功能參照手冊
2.3. Frequency Based Statistical Procedures menu
2.3.1 Frequency
計算summary statistics。包括 Sample Size, No. Alleles, No. Effective Alleles, Information Index, Observed Heterozygosity, Expected and Unbiased Expected Heterozygosity, and Fixation Index。
參數(shù)計算較簡單,結(jié)果文件中有部分參數(shù)的計算公式,群體基礎(chǔ)上的平均等位基因數(shù)沒有表現(xiàn)出計算方法。目前只熟悉了 等位基因頻率相關(guān)、AMOVA、主成分分析 。也都是一鍵操作。
2.3.1.1 計算所有位點的的遺傳多樣性信息
如果計算所有位點的的遺傳多樣性信息,需要將所有樣本數(shù)據(jù)視為一個群體。怎么樣把已劃分為多個群體的樣本重新劃分為一個群體呢,a,重新更改原始數(shù)據(jù)文件夾,將第二列即群體名稱列更改為一個相同的名稱,b,Genalex中操作,將所有樣本視為一個群體,即更改Pops數(shù)量,重新添加每個不同的群體數(shù)量,當(dāng)前群體數(shù)量為1,整個1個群體數(shù)量為42.
經(jīng)過測試,更改原始數(shù)據(jù)文件中群體列或直接在軟件中操作,結(jié)果是一樣的
如果原始數(shù)據(jù)中選擇以下參數(shù),

不同位點的遺傳多樣性參數(shù)數(shù)值的平均值就是這個群體的遺傳多樣性參數(shù)數(shù)值

計算 Fis FiT FST 分別表示近郊系數(shù)

Fis = (Mean He - Mean Ho) / Mean He
F = Fixation Index = (He - Ho) / He = 1 - (Ho / He)
如果只有一個群體是無法計算Fis的,比如位點a在群體1 、2、3共三個群體的平均 he ho 就可以計算Fis,Fis描述的是不同的群體之間的一些信息。當(dāng)只有一個群體是是固定系數(shù)?
2.3.1.2 不同群體間的遺傳多樣性
方法參照2.3.3.1 ,只是將蔣樣本視為分為多個群體
2.3.1.3 AMOVA
之間選擇Distance based下的AMOVA,確認群體個數(shù)及樣本量,并選擇合適參數(shù),或者選擇所有 參數(shù),看哪一個是自己需要的結(jié)果。其中Fst sheet中是需要的AMOVA結(jié)果,結(jié)果也會有Fst 及NM的值, Fst的值與Gnepop得到 的結(jié)果數(shù)字大小差別不大,

amove 結(jié)果中 55% Within Indiv, 40% Among individ, 5% Among pops什么意思
答1. Variation within individuals compares molecular markers within the same individual plant (for some reason), whereas among individuals compare two different plants in the same population. 2. There are three levels because there must be three factors in the AMOVA, or two factors considered individually and have been crossed or nested as well. 3. There are at least two populations since population is a factor, but variation due to this factor is very low (5%).
就是個體內(nèi),比較的個體內(nèi)不同位點,的變異。
個體間比較的是,同一群體間不同個體間的差異
2.3 DISTANCE BASED
2.3.1 PCA
需要先計算遺傳距離,然后選擇合適的PCOA method,
The first two methods are based on the covariance matrix and latter two on the distance matrix。

也有的文獻是直接用的genalex的結(jié)果圖

在PCA圖中做圈圈標(biāo)注,需要提前設(shè)置分組,在R中使用geom_encircle畫圖,先畫出各個樣本的點,然后使用不同分組中的點(同一種群等)進行畫圈。參見

2.3.2 Mantel
Mantel下有多個選項,paried為得到兩個矩陣之間關(guān)系,Multi為多個矩陣之間的互相關(guān)系,Compare 為一個矩陣與其他矩陣之間。一般paried可得到遺傳距離與遺傳多樣性之間的關(guān)系,

此需要2個表格,樣本之間的地理距離矩陣與遺傳距離矩陣表格,地理距離矩陣表格可根據(jù)經(jīng)緯度計算,遺傳距離矩陣根據(jù)ssr數(shù)據(jù)得到,然后在Mantel里選擇2個矩陣表格即可。關(guān)于經(jīng)緯度格式可使用creat先生成一個隨機的合格數(shù)據(jù)格式的數(shù)據(jù)


