Introduction
了解控制群落多樣性、功能、演替和生物地理學(xué)的機(jī)制是生態(tài)學(xué),尤其是微生物生態(tài)學(xué)中的一個(gè)核心。推薦閱讀綜述:
Zhou, J. & Ning, D. Stochastic Community Assembly: Does It Matter in Microbial Ecology? Microbiol Mol Biol Rev 81, e00002-17 (2017).
This review is very comprehensive (1)!
周集中老師實(shí)驗(yàn)室的長(zhǎng)期研究興趣集中在從基因組到生態(tài)系統(tǒng)的不同組織層面的環(huán)境微生物學(xué),其中一項(xiàng)就是宏基因組學(xué)和微生物生態(tài)學(xué):利用高通量基因組測(cè)序和相關(guān)基因組學(xué)技術(shù)檢查不同棲息地的微生物群落多樣性、微生物生物地理學(xué)和形成微生物多樣性模式、分布和動(dòng)態(tài)的機(jī)制;
Understanding the mechanisms controlling community diversity, functions, succession, and biogeography is a central, but poorly understood, topic in ecology, particularly in microbial ecology. Traditional niche-based theory hypothesizes that deterministic factors such as species traits, inter-species interactions (e.g., competition, predation, mutualisms, and trade-offs), and environmental conditions (e.g., pH, temperature, salt, and moisture) govern community structure, which are often referred to as deterministic processes.
In contrast, neutral theory assumes that community structures are independent of species traits and governed by stochastic processes of birth, death, colonization, extinction, and speciation.
Although, recently, it has been generally accepted that both deterministic and stochastic processes occur simultaneously in the assembly of local communities, a central debate is on their relative importance in controlling community structure, succession, and biogeography.
Methods
目前在文章中普遍出現(xiàn)的計(jì)算群落構(gòu)建的方法主要有三套:
1.Stegen (βNTI & RCbray-based)

在確定性與隨機(jī)性二分法的背景下塑造微生物群落多樣性的生態(tài)過(guò)程。該方案顯示了在文中討論的假設(shè)下,基于系統(tǒng)發(fā)育和分類多樣性劃分各種生態(tài)過(guò)程的不同步驟。 NTI(最近分類單元指數(shù))基于系統(tǒng)發(fā)育多樣性指數(shù) MNTD(平均最近分類單元距離)的空模型檢驗(yàn),RCBray(修正的 Raup-Crick 指數(shù))基于 Bray-Curtis 的空模型檢驗(yàn)分類多樣性指數(shù)。這兩個(gè)框分別表示確定性選擇和未支配部分的主要組成部分。除了影響較小的選擇外,未支配部分的弱選擇也可能是由于抵消了有影響的選擇因素和/或不同分類群的對(duì)比選擇。該圖主要是根據(jù) Stegen 等人先前報(bào)告的數(shù)據(jù)制作的。
beta-NTI(nearest taxon index):

使用 NTI/NRI 指示單個(gè)群落內(nèi)共存的分類單元相比偶然預(yù)期的關(guān)系更為緊密還是分散,使用 βNTI/βNRI 指示兩兩群落間的變化受確定性或隨機(jī)性因素影響的大小。
MNTD 即mean-nearest-taxon-distance (最近種間平均進(jìn)化距離) , 關(guān)于 NTI/NRI、βNTI/βNRI 的結(jié)果解釋時(shí)其顯著性的判斷依據(jù)是其臨界值是否大于|2|,實(shí)際上這是依據(jù)標(biāo)準(zhǔn)正態(tài)分布的 95%置信區(qū)間得到的,一般認(rèn)為 NRI 或者 NTI 大于 1.96 或者小于-1.96 的結(jié)果,在 95%的水平是顯著的。
RCbray: 相異指數(shù)的一種。
code
https://blog.csdn.net/weixin_43367441/article/details/118515090
非常重要的一點(diǎn):這類方法是基于系統(tǒng)發(fā)育樹推斷的,所以一定要有跟tax表對(duì)應(yīng)的系統(tǒng)發(fā)育樹。 如果用的是16S/ITS測(cè)序,可以通過(guò)擴(kuò)增子數(shù)據(jù)多序列比對(duì)并建一個(gè)樹。
如果已有物種的genome,可以根據(jù)GTDB數(shù)據(jù)庫(kù)的保守基因來(lái)建樹。
如果只有物種名稱,替代方法是利用階層分類關(guān)系(界門綱目科屬種)來(lái)做一個(gè)擬系統(tǒng)發(fā)育樹(枝長(zhǎng)都為1) ,參見pctax的df2tree函數(shù):
library(pcutils)
library(pctax)
data(otutab,package = "pcutils")
df2tree(taxonomy)->phylo
#計(jì)算
nti_rc(otutab,phylo,metadata[,"Group",drop=F])->nti_res
#可視化
nti_res$type=factor(nti_res$type,levels = c("Homo_S","Heter_S","Homo_D","D_limit","Undominated"))
table(nti_res$type,nti_res$variable)%>%data.frame()%>%
reshape2::acast(Var1~Var2)->com_p
stackplot(com_p)+scale_fill_pc()

iCAMP
現(xiàn)在大家經(jīng)常用的iCAMP包就是基于這個(gè)理論框架進(jìn)行分析的 (4),其進(jìn)行了一定的升級(jí)優(yōu)化:提出了系統(tǒng)發(fā)育分箱零模型。下次用在自己項(xiàng)目中的話可以進(jìn)一步分享。
2.ST,NST,MST (stochasticity ratio)
PNAS:NST方法定量生態(tài)過(guò)程中的隨機(jī)性
周老師的新文章,開發(fā)出新的方法對(duì)生態(tài)過(guò)程中的隨機(jī)性進(jìn)行了定量。提出了一個(gè)新的指數(shù),normalized stochasticity ratio (NST),作為確定性主導(dǎo)(deterministic, <50%)和隨機(jī)性主導(dǎo)(stochastic, >50%)的邊界點(diǎn) (5)。

code
已經(jīng)有相應(yīng)的計(jì)算R包了:NST
#install.packages("NST")
library(NST)
data(tda)
comm=tda$comm
bray=beta.g(comm,dist.method="bray")
bray.3col=dist.3col(bray)
group=tda$group
tnst=tNST(comm=comm, group=group, rand=20,
output.rand=TRUE, nworker=1)
#檢驗(yàn)各組ST、NST的分布情況及各組ST、NST差異的顯著性。
nst.bt=nst.boot(nst.result=tnst, group=NULL, rand=99,
trace=TRUE, two.tail=FALSE, out.detail=FALSE,
between.group=FALSE, nworker=1)
#ST和NST組間進(jìn)行Permutational multivariate ANOVA
nst.pova=nst.panova(nst.result=tnst, rand=99)
#可視化
group_box(tnst$index.pair.grp, group = tnst$index.pair.grp$group,
mode = 3,p_value2 = T)

example

地下水微生物群落演替過(guò)程中估計(jì)的 NST 動(dòng)態(tài)變化對(duì)乳化植物油注入的響應(yīng)。 NST 是基于 (A) Jaccard 和 (B) Ru ziˇ cka 指標(biāo)使用空模型算法 PF 計(jì)算的。在零模型 PF 中,類群發(fā)生的概率與觀察到的發(fā)生頻率成正比,并且每個(gè)樣本中的類群豐富度是固定的(19)。當(dāng)使用基于豐度的指標(biāo) Ru ziˇ cka 時(shí),每個(gè)樣本中的空分類群豐度被計(jì)算為觀察到的個(gè)體數(shù)量的隨機(jī)抽取,其概率與樣本中空分類群的區(qū)域相對(duì)豐度成比例(26)。 W8 是植物油對(duì)其沒(méi)有影響或影響最小的對(duì)照井。
3.Solan NCM
只有當(dāng)物種死亡或離開這個(gè)系統(tǒng)時(shí),群落結(jié)構(gòu)才會(huì)發(fā)生改變。此時(shí),離開個(gè)體的生態(tài)位就會(huì)空余出來(lái),其它個(gè)體會(huì)通過(guò)來(lái)自群落外的遷移或群落內(nèi)部的繁殖來(lái)填補(bǔ)空出的生態(tài)位。因此可以把群落的動(dòng)態(tài)描述為死亡——繁殖/擴(kuò)散——死亡這樣的循環(huán) (6)。
計(jì)算公式:
物種 i 占居的頻率(occurrence frequency: row sums of binary OTU table/number of sites)為其概率密度函數(shù)的積分。 此時(shí)該分布是一個(gè)beta分布,我們就可以在R語(yǔ)言中利用beta分布對(duì)其進(jìn)行擬合,獲得參數(shù)m的評(píng)估值。
code
library(devtools)
install_github("Russel88/MicEco")
library(MicEco)
neutral.fit(t(otutab))#使用的是最大似然估計(jì)擬合模型,R2計(jì)算方法也不同
另一個(gè)代碼來(lái)自https://mp.weixin.qq.com/s/opFXl-TvkJfmPcWKFwhCFA,比較經(jīng)典,用的是非線性模型:
N描述了宏群落規(guī)模(metacommunity size),在本文中為每個(gè)樣本中所有OTU的總豐度。 m量化了群落層面的遷移率(migration rate),該值對(duì)于每個(gè)群落成員都是統(tǒng)一的(與物種無(wú)關(guān)),m值越小說(shuō)明整個(gè)群落中物種擴(kuò)散越受限制,反之m值越高則表明物種受到擴(kuò)散限制越低。 Nm是元群落規(guī)模(N)與遷移率(m)的乘積 (Nm = N*m),量化了對(duì)群落之間擴(kuò)散的估計(jì),決定了發(fā)生頻率和區(qū)域相對(duì)豐度之間的相關(guān)性。
可以使用pctax中的繪圖代碼:
data(otutab)
ncm(otutab)->ncm_res
plot(ncm_res)

R2代表了中性群落模型的整體擬合優(yōu)度,R2越高表明越接近中性模型,即群落的構(gòu)建受隨機(jī)性過(guò)程的影響越大,受確定性過(guò)程的影響越小。
值得注意,R方不是某個(gè)數(shù)值的平方,可以是負(fù)值。因?yàn)閿M合程度沒(méi)有下限,可以無(wú)限差,R方的范圍是(?∞,1]。R方的取值,有以下的可能性:
等于1。理想狀況,該模型對(duì)所有的真值預(yù)測(cè)準(zhǔn)確,沒(méi)有偏差。潑個(gè)冷水,如果某篇文章里出現(xiàn)了R方=1,要么是問(wèn)題過(guò)于簡(jiǎn)單沒(méi)有研究?jī)r(jià)值,要么是模型過(guò)于復(fù)雜,對(duì)數(shù)據(jù)進(jìn)行了過(guò)度擬合。
小于1大于0。這是常見狀況,表明該模型的擬合水平比均值模型好。
等于0。該模型的擬合水平接近于均值模型。該模型沒(méi)有價(jià)值。
小于0。該模型的擬合水平不如均值模型。同樣,該模型沒(méi)有價(jià)值。
example
隨機(jī)過(guò)程,例如散布、出生、死亡、滅絕和移民,在呼氣細(xì)菌和真菌群落的組裝中發(fā)揮作用。真菌微生物群的 SNM 擬合性能(圖 2)優(yōu)于細(xì)菌(細(xì)菌 R2 = 0.353,真菌 R2 = 0.683)。這種差異表明隨機(jī)過(guò)程對(duì)于 EBC 真菌群落的組裝可能相對(duì)更重要,而對(duì) EBC 細(xì)菌群落的組裝則不太重要。這種現(xiàn)象可能與細(xì)菌和真菌之間的大小差異有關(guān),較小的細(xì)菌受擴(kuò)散限制的影響較小,而受確定性過(guò)程的影響更大 (7)。

Stochastic processes played a role in assembling expiratory bacterial (A) and fungal (B) communities based on Sloan neutral model fitting. The black solid line represents the best fit, and the dotted lines represent the 95% CI (confidence interval) around the model fit. The blue dots refer to taxa that occur more frequently than predicted, and the red dots refer to taxa that occur less frequently than predicted. The green dots refer to taxa that occur in a manner consistent with predicted values.
原核生物細(xì)胞直徑大概在0.5 ~ 2.0 μm; 微真核生物個(gè)體大小大概在1 ~ 200 mm; 之前的研究已經(jīng)報(bào)道了較小的生物不太可能受到擴(kuò)散限制的影響,因?yàn)樗鼈兣c較大的生物相比具有更高的擴(kuò)散能力。因此假設(shè)在細(xì)菌群落中生態(tài)位過(guò)程的相對(duì)影響可能比在微真核生物群落中更強(qiáng)。微真核生物個(gè)體大,可能會(huì)影響其擴(kuò)散過(guò)程。
Others
參考自歷神公眾號(hào)文章:https://mp.weixin.qq.com/s/nwNuPlY7x6VScJA44c0MjQ
Competitive lottery
基于競(jìng)爭(zhēng)彩票模型(competitive lottery model)的群落構(gòu)建 假設(shè)一個(gè)兩步模型:在第一步中,樣本的總豐度(100%)根據(jù)某個(gè)未知的過(guò)程在組之間分配。 然后在第二步中,分配給每個(gè)小組的豐度會(huì)根據(jù)一個(gè)競(jìng)爭(zhēng)彩票模式在小組成員之間進(jìn)行分配。 競(jìng)爭(zhēng)彩票模型的概念說(shuō)明:
在第一階段,每個(gè)樣本的總豐度(100%)在一組預(yù)定義的組之間進(jìn)行分割。
在第二階段,每一組的豐度分配根據(jù)競(jìng)爭(zhēng)彩票模型在子組之間進(jìn)行分配,其中一個(gè)子組獲得了大部分的豐度。
DNCI
在PER-SIMPER方法的基礎(chǔ)上,提出了一個(gè)新的度量指標(biāo): dispersal–niche continuum index (DNCI),該指數(shù)可估計(jì)是擴(kuò)散過(guò)程還是生態(tài)位過(guò)程主導(dǎo)群落的構(gòu)建,并便于不同數(shù)據(jù)集之間的比較。
PER-SIMPER利用物種在不同站點(diǎn)之間的矩陣,在排列過(guò)程中生成三種不同的零模型: 通過(guò)約束行(生態(tài)位構(gòu)建)、約束列(擴(kuò)散構(gòu)建)或兩者都約束。 PER-SIMPER利用SIMPER方法對(duì)原始群落矩陣組成相似度模式進(jìn)行建模,并與三個(gè)零模型比較。 PER-SIMPER通過(guò)識(shí)別哪個(gè)零模型與經(jīng)驗(yàn)分析最匹配來(lái)進(jìn)行定性評(píng)估。然而,大多數(shù)群落都是由生態(tài)位和擴(kuò)散過(guò)程共同構(gòu)成的,這限制了構(gòu)建機(jī)制定性方法的敏感性。此外簡(jiǎn)單決策過(guò)程的定性特性使不同群落之間的構(gòu)建過(guò)程難以進(jìn)行精確比較。
PER-SIMPER分析返回三個(gè)E-metric分布,這與SIMPER經(jīng)驗(yàn)值與三個(gè)PER-SIMPER零模型之間的偏差相關(guān)。本文提出的新的DNCI是由這些計(jì)算的E值推導(dǎo)而來(lái)的。 定量結(jié)果是基于標(biāo)準(zhǔn)效應(yīng)量En(即來(lái)自”生態(tài)位”模型的E-metric分布)減去標(biāo)準(zhǔn)效應(yīng)量Ed (即來(lái)自”擴(kuò)散”模型的E-metric分布)。 DNCI提供了一種方法來(lái)量化和比較跨數(shù)據(jù)集構(gòu)建過(guò)程的強(qiáng)度。DNCI值正或負(fù)表明生態(tài)位或分散過(guò)程分別是群組構(gòu)建的主要過(guò)程。指數(shù)的絕對(duì)值越高,代表占主導(dǎo)地位的構(gòu)建過(guò)程的潛力越大。
如果DNCI與0差異不顯著,則可以認(rèn)為擴(kuò)散過(guò)程和生態(tài)位過(guò)程對(duì)群落構(gòu)建的影響是相等的。 當(dāng)DNCI顯著低于0時(shí),擴(kuò)散過(guò)程是群落構(gòu)建的主導(dǎo)驅(qū)動(dòng)因素; 如果DNCI顯著高于0,生態(tài)位過(guò)程是群落構(gòu)建的主要決定因素。 注意,表明擴(kuò)散過(guò)程優(yōu)勢(shì)的負(fù)DNCI值并不能提供實(shí)際擴(kuò)散速率的信息。
References
- J. Zhou, D. Ning, Stochastic Community Assembly: Does It Matter in Microbial Ecology? Microbiology and Molecular Biology Reviews. 81, e00002–17 (2017).
- J. C. Stegen, X. Lin, J. K. Fredrickson, X. Chen, et al., Quantifying community assembly processes and identifying features that impose them. The ISME Journal. 7, 2069–2079 (2013).
- J. C. Stegen, X. Lin, A. E. Konopka, J. K. Fredrickson, Stochastic and deterministic assembly processes in subsurface microbial communities. The ISME Journal. 6, 1653–1664 (2012).
- D. Ning, M. Yuan, L. Wu, Y. Zhang, et al., A quantitative framework reveals ecological drivers of grassland microbial community assembly in response to warming. Nature Communications. 11, 4717 (2020).
- D. Ning, Y. Deng, J. M. Tiedje, J. Zhou, A general framework for quantitatively assessing ecological stochasticity. Proceedings of the National Academy of Sciences. 116, 16892–16898 (2019).
- W. T. Sloan, M. Lunn, S. Woodcock, I. M. Head, et al., Quantifying the roles of immigration and chance in shaping prokaryote community structure. Environmental Microbiology. 8, 732–740 (2006).
- Y. Zhang, F. Shen, Y. Yang, M. Niu, et al., Insights into the Profile of the Human Expiratory Microbiota and Its Associations with Indoor Microbiotas. Environmental Science & Technology. 56, 6282–6293 (2022).