進(jìn)化樹(shù)上的N種數(shù)值

序言

大晚上的不知道干些啥好,想起了之前積累的一個(gè)小小的問(wèn)題。
這里搜一下資料,快速的整理出一小篇文章好了~

內(nèi)容大概就是 N種phylogenetic tree上不同的數(shù)字

https://www.researchgate.net/figure/The-phylogenetic-tree-of-Bacillus-sp-D12-based-on-16S-rRNANCBI-accession-number-of-each_fig1_281824668

基本的系統(tǒng)發(fā)育樹(shù)

系統(tǒng)發(fā)育樹(shù)大概是最最常見(jiàn)的一個(gè)結(jié)果圖了,大家都知道樹(shù)長(zhǎng)什么樣,但是卻不一定知道上面的數(shù)字意義是什么。又或者只知道其中的幾種。


The tree terminology

以上的樹(shù)結(jié)構(gòu),算是比較常見(jiàn)的一種,一般也會(huì)有圖例表示,多長(zhǎng)的長(zhǎng)度代表多遠(yuǎn)的距離,所以甚至?xí)?strong>不標(biāo)記任何的數(shù)字,因?yàn)橹чL(zhǎng)(branch length)本身就攜帶了大量的信息。

那么如何閱讀一棵樹(shù)的信息呢,上圖也寫的比較清楚。物種A與物種B的距離就是AA+BB,至于這個(gè)支長(zhǎng)是什么,下文再去說(shuō)有哪些測(cè)度(metrics)可以用以表征這個(gè)相似度,但是總的而言,如果需要比較兩個(gè)物種的距離,即支長(zhǎng)的不斷相加。

樹(shù)是什么?

如果要我解釋的話。

樹(shù)就是距離矩陣的可視化結(jié)果

每個(gè)葉子節(jié)點(diǎn)就是距離矩陣的橫軸或者縱軸,由于樹(shù)上每?jī)蓚€(gè)葉子節(jié)點(diǎn)間都可以兩兩到達(dá),結(jié)合上述的物種的距離,最后就會(huì)得到一個(gè)距離矩陣,而一個(gè)距離矩陣卻可以得到多個(gè)樹(shù)的結(jié)果。(取決于 有/無(wú)根 樹(shù)的畫法等)

數(shù)字的定義

Coinfection with a novel fibropapilloma-associated herpesvirus and a novel Spirorchis sp. in an eastern box turtle (Terrapene carolina) in Florida

上述的定義,其實(shí)也可以看這篇文獻(xiàn)的原始的legend。首先斜杠不代表除法,僅僅代表的意思。左側(cè)貝葉斯后驗(yàn)概率的百分比,右側(cè)是通過(guò)bootstrap進(jìn)行計(jì)算的百分比,簡(jiǎn)單點(diǎn)說(shuō),兩個(gè)都是代表了這個(gè)node以下的樹(shù)結(jié)構(gòu)的可靠程度。
關(guān)于bootstrap的計(jì)算,可以參考Bootstrapping phylogenetic Trees: theory and methods

Genome and transcriptome sequencing identifies breeding targets in the orphan crop tef (Eragrostis tef)

標(biāo)在Node(頂點(diǎn))上的數(shù)字,大多為置信程度,代表該node以下的樹(shù)結(jié)構(gòu)的可靠程度 (A圖)
標(biāo)在邊上的數(shù)字,則為支長(zhǎng)的具體數(shù)值。(B圖)

建樹(shù)的方法

雖然建樹(shù)的標(biāo)準(zhǔn)有很多,但是概括來(lái)說(shuō),phylogenetic tree的方法有三種

1. Parsimony (簡(jiǎn)約法)

將需要比較的東西進(jìn)行 binary(二元)化,例如有無(wú)毛發(fā),有無(wú)皮膚等基于特征的方法。


簡(jiǎn)約法

為什么叫簡(jiǎn)約法?
就是因?yàn)槎螅ㄟ^(guò)層次遞進(jìn),就可以推導(dǎo)出共同祖先。即用最少的信息即可描述子節(jié)點(diǎn)的過(guò)程。

2. Distance Matrix based

基于距離矩陣,有距離矩陣就有樹(shù)。。。如上

3. Maximum likelihood(最大似然)

通過(guò)最大似然的估算,一個(gè)很長(zhǎng)的貝葉斯概率計(jì)算,通過(guò)最大化結(jié)果,從而得到樹(shù)


結(jié)尾

。。。這是篇很簡(jiǎn)單以及很水的文章(畢竟只花了1h不到。。),希望大家也可以1分鐘看完。。

reference

Phylogenetics
PCB_Lect11_Phylogen_Trees.pdf
youtube Maximum likelihood for phylogenetic tree reconstruction

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 系統(tǒng)發(fā)育學(xué)概念 系統(tǒng)發(fā)生(或種系發(fā)生、系統(tǒng)發(fā)育,phylogeny)是指生物形成或進(jìn)化的歷史。系統(tǒng)發(fā)生學(xué)(phyl...
    lakeseafly閱讀 16,850評(píng)論 0 29
  • (一)分子進(jìn)化的研究方法 1. 分子進(jìn)化研究的意義 自20世紀(jì)中葉,隨著分子生物學(xué)的不斷發(fā)展,進(jìn)化研究也進(jìn)入了分子...
    bioinfo2011閱讀 7,524評(píng)論 0 20
  • 會(huì)講故事的人簡(jiǎn)直不得了。 一款洗發(fā)水新上市,新品牌,在幾個(gè)微信公眾號(hào)上,來(lái)回發(fā)幾次文之后,我不想知道也就知道了。不...
    路小fei閱讀 330評(píng)論 0 0
  • 憶_然閱讀 369評(píng)論 0 0
  • 這幾天,天天學(xué)習(xí),睡得遲也醒得晚。昨天的課 程我反復(fù)聽(tīng)了三遍,特別受益。是一個(gè)中學(xué)英語(yǔ)老師的分享,說(shuō)他學(xué)習(xí)了16...
    三生三世白淺閱讀 264評(píng)論 0 0

友情鏈接更多精彩內(nèi)容