網(wǎng)絡(luò)上關(guān)于構(gòu)建進(jìn)化樹的教程非常多,這里只挑重點(diǎn)部分講解。
常見算法:Neighbor-Joining、Maximum Likelihood
1. 參數(shù)設(shè)置:


Test of Phylogeny:建樹的檢驗(yàn)方法
常用Boot strap method (步長(zhǎng)檢驗(yàn))
是根據(jù)所選的建樹方法,計(jì)算并繪制指定次數(shù)棵系統(tǒng)發(fā)育樹。大多數(shù)建樹方法的核心算法都是統(tǒng)計(jì)概率模型,所以每次算出的數(shù)都會(huì)有所差別,用Boot strap method檢驗(yàn)方法,建好的系統(tǒng)發(fā)育樹上每個(gè)節(jié)點(diǎn)上都會(huì)標(biāo)記一個(gè)數(shù)字,代表了指定次數(shù)次計(jì)算所得出的系統(tǒng)發(fā)育樹中有百分之幾的樹都有這一節(jié)點(diǎn)。絕大多數(shù)節(jié)點(diǎn)數(shù)值大于70%的樹才可信,個(gè)別低于70%也可忽略。也可以通過(guò)增刪序列來(lái)改善質(zhì)量。
No. of Bootstrap Replications:一般設(shè)置步長(zhǎng)為500-1000;
Substitution Model :計(jì)算遺傳距離時(shí)使用的計(jì)算模型
Model/Method: p-distance
理論上需嘗試各種模式,然后選擇合適的模型進(jìn)行計(jì)算。實(shí)際操作中通常選擇距離模型,如p-distance即可。
Gaps/Missing Data Treatment:
刪除多序列比對(duì)中含有空位的列,遺傳距離度量方法不同,刪減原則不同;
如序列間不同殘基個(gè)數(shù)來(lái)度量遺傳距離,則選擇complete deletion ;
如采用Neighbor-Joining,則選擇Partial deletion部分刪除,刪除程度保持50%。
2. 生成進(jìn)化樹
左側(cè)標(biāo)簽頁(yè):
原始樹:步長(zhǎng)檢驗(yàn)時(shí)構(gòu)建1000棵樹中的一個(gè)。未經(jīng)過(guò)多棵樹合并,樹的長(zhǎng)短可精確代表遺傳距離。
右側(cè)標(biāo)簽頁(yè):
步長(zhǎng)檢驗(yàn)合并樹,樹上節(jié)點(diǎn)處數(shù)字表示經(jīng)過(guò)步長(zhǎng)檢驗(yàn),有x%個(gè)樹都具有這個(gè)數(shù)支。反應(yīng)了樹支的可信度

3. 樹形美化:
View > Options

更改樹支形狀或根等:

導(dǎo)出為矢量格式,如pdf 或EMF,添加到AI中進(jìn)行下一步美化,呈現(xiàn)效果如下:

4. 遺傳距離計(jì)算
"Distance" > "compute pairwise Distances"

設(shè)置參數(shù)如上,繼續(xù)下一步


5. 文件保存
- 序列比對(duì)的結(jié)果保存:
"data" > "save session ",文件后綴名為.mas
打開文件:"Align" > "Open saved Alignment session"
"Export Alignment" > "MEGA Format",文件后綴名為.meg
打開文件:雙擊文件即可打卡
- 進(jìn)化樹保存
"File" > "Save current session" ,文件后綴名為.MTS
打開:"User Tree" > "Open Tree Session"
Display Newick Trees,文件后綴名為.nwk
"File" > "Export current Tree (Newick)"
注意,打開的nwk文件只有整合后樹文件,而沒有源樹支。nwk文件可以導(dǎo)入其他在線的進(jìn)化樹美化網(wǎng)站做進(jìn)一步地修飾。
- 導(dǎo)出圖片:
"image" 選擇導(dǎo)出EMF PDF PNG格式的圖片。
參考資料: