進(jìn)化樹或者系統(tǒng)發(fā)育樹在微生物及群體結(jié)構(gòu)分析中是很常見的分析條目。進(jìn)化樹構(gòu)建有很多方法,結(jié)果也大體相似,但是最終呈現(xiàn)的形式確是多種多樣的,今天給大家介紹使用itol進(jìn)行進(jìn)化樹的上色美化。
進(jìn)化樹數(shù)據(jù)
itol支持多種進(jìn)化樹數(shù)據(jù),包括Newick, Nexus, PhyloXML和Jplace。上傳的數(shù)據(jù)必須是文本格式,其中Jplace格式的文件后綴必須是*.Jplace,否則會(huì)出現(xiàn)加載錯(cuò)誤的問題,以下是具體的進(jìn)化樹上傳文件的說明信息。
Tree with bootstraps and branch lengths:
(A:0.1,(B:0.1,C:0.1)90:0.1)98:0.3);
A, B, C : leaf names
0.1, 0.3 : branch lengths
90,98 : bootstrap values
Tree with internal node IDs:
(A:0.1,(B:0.1,C:0.1)INT1:0.1[90])INT2:0.3[98]);
A, B, C : leaf names
INT1, INT2 : internal node IDs
0.1, 0.3 : branch lengths
90,98 : bootstrap values
Tree with NHX style metadata:
(A:0.1,(B:0.2,(C:0.2,D:0.3):0.4[&&NHX:conf=0.01:name=NODE1]):0.5);
A, B, C : leaf names
internal node will have the ID NODE1
metadata value 'conf' will be available for visualization
MrBayes tree with full metadata:
( n1[&prob=1.00000000e+00,prob_stddev=0.00000000e+00,prob_range={1.00000000e+00,1.00000000e+00}, prob(percent)="100",prob+-sd="100+-0"]:7.827820e-02[&length_mean=7.95052056e-02, length_median=7.82782000e-02,length_95%HPD={5.41722800e-02,1.09222000e-01}],
n2[&prob=1.00000000e+00,prob_stddev=0.00000000e+00,prob_range={1.00000000e+00,1.00000000e+00}, prob(percent)="100",prob+-sd="100+-0"]:1.029146e-01[&length_mean=1.03620749e-01, length_median=1.02914600e-01,length_95%HPD={7.64916100e-02,1.34490900e-01}] )[&prob=1.00000000e+00, prob_stddev=0.00000000e+00,prob_range={1.00000000e+00,1.00000000e+00}, prob(percent)="100",prob+-sd="100+-0"]:1.905703e-01[&length_mean=1.91679099e-01, length_median=1.90570300e-01,length_95%HPD={1.37001000e-01,2.53530500e-01}];
n1, n2: leaf names
prob, prob_stddev, prob(percent) ... : various metadata fields which can be used in'Bootstraps/metadata' section
進(jìn)化樹繪制類型
itol能繪制的圖形主要包括以下幾種:正常進(jìn)化樹(矩形,上下對比,a)、三角進(jìn)化樹(三角形,b)、圓形進(jìn)化樹(非封閉圓環(huán),c)、正常進(jìn)化樹(圓角分支,d)、普通無根進(jìn)化樹(無根樹,e)以及分支無根進(jìn)化樹(分支,f)等六種。
對于圖形的選擇,可以參考樣本及數(shù)據(jù)的實(shí)際情況,比如熱圖、添加比對序列、蛋白模塊等的進(jìn)化樹必須使用normal形式的數(shù)據(jù)(a, b, d),對于主要顯示進(jìn)化分組的差別,可以優(yōu)先選擇circle或者unroot格式的進(jìn)化樹(c, e, f),這樣篇幅不會(huì)太長,比較直觀。
進(jìn)化樹美化上色
itol所有的美化上色均可以通過配置文件來完成,主要分為參數(shù)設(shè)置及數(shù)據(jù)表兩種類型。
- 參數(shù)設(shè)置
對于參數(shù)設(shè)置,只要按照既定的要求給出設(shè)定閾值即可,示例如下。
LABELS
DATA
#NODE_ID,LABEL
#Examples
#defined a name for an internal node
9606|9031 Metazoa
#change the label for leaf node 9606
4530 Oryza sativa
45157 Cyanidioschyzon merolae
237895 Cryptosporidium hominis
184922 Giardia lamblia
56636 Aeropyrum pernix
3702 Arabidopsis thaliana
33169 Eremothecium gossypii
222523 Bacillus cereus ATCC 10987
1423 Bacillus subtilis
216816 Bifidobacterium longum
以上是修改標(biāo)簽顯示的配置文件,第一行顯示修改的內(nèi)容,第二行DATA顯示接下來的內(nèi)容為設(shè)置參數(shù),其后的正文部分是對每一個(gè)樣本或者分支節(jié)點(diǎn)進(jìn)行設(shè)置。
- 數(shù)據(jù)表
數(shù)據(jù)表類型的文件主要是增加進(jìn)化樹上的顯示數(shù)據(jù),比如增加比對序列,熱圖,樣本間的互作關(guān)系,蛋白模塊等。
DATASET_CONNECTION
#NODE1,NODE2,WIDTH,COLOR,LABEL
155864 1299 26 rgba(217,112,113,0.5) dashed Connection 155864 to somewhere...
155864 1488 19 rgba(1,220,217,0.7) normal Connection 155864 to somewhere...
83334 562 17 rgba(8,180,164,0.2) dashed Connection 83334 to somewhere...
83334 36329 11 rgba(15,57,145,0.1) normal Connection 83334 to somewhere...
217992 7227 27 rgba(233,166,147,0.5) normal Connection 217992 to somewhere...
217992 183190 30 rgba(136,199,114,1.0) normal Connection 217992 to somewhere...
562 184922 12 rgba(229,41,244,1.0) dashed Connection 562 to somewhere...
562 56636 16 rgba(6,233,101,0.8) dashed Connection 562 to somewhere...
以上是添加互作關(guān)系的數(shù)據(jù)表設(shè)置格式,與參數(shù)設(shè)置基本一致,唯一的區(qū)別在于文件第一行要指定作圖的類型,此處是互作關(guān)系圖。
作圖示例
以下是通過設(shè)置不同的數(shù)據(jù)表及參數(shù)設(shè)置文件,實(shí)現(xiàn)不同類型的進(jìn)化樹示例。
- 添加分組信息
該類型進(jìn)化樹表現(xiàn)樣本的分組關(guān)系,便于分析進(jìn)行關(guān)系及樣本分布情況。
- 添加boostrip
該類型進(jìn)化樹反應(yīng)的是結(jié)果的準(zhǔn)確程度,自展值越大,進(jìn)化樹反應(yīng)的結(jié)果越準(zhǔn)確。
- 添加柱狀圖
添加樣本對應(yīng)的數(shù)據(jù),比如豐度,表達(dá)量等。
- 添加比對序列
添加樣本/物種對應(yīng)的比對序列,直觀反應(yīng)基因的相似性程度。
- 添加環(huán)境因子效應(yīng)
添加環(huán)境因子效應(yīng)值,用于展示不同樣本/物種對特定影響因子的表現(xiàn)。
- 添加熱圖
熱圖就不用說了,很常見。
- 添加互作網(wǎng)絡(luò)
該類型進(jìn)化樹主要反應(yīng)的樣本間的相互關(guān)系。
- 添加蛋白模塊
該類型的進(jìn)化樹添加了物種/樣本特異性蛋白結(jié)果模塊或者特征標(biāo)簽。
除此之外,還可以添加文字、圖片、餅狀圖等其他類型,有興趣的話可以去試試。
如果有作圖需求,歡迎來聊。