譯文:分段式結(jié)構(gòu)方程模型(piecewiseSEM)的構(gòu)建原理

前言-寫在前面
在進(jìn)行一些論文研讀的過程中,我發(fā)現(xiàn)針對模型復(fù)雜生態(tài)系統(tǒng)(比如農(nóng)田土壤微生物的宏基因組學(xué)研究),研究者會(huì)將微生物基因豐度、環(huán)境因子等整合到一個(gè)SEM模型當(dāng)中,由此來觀察各變量之間直接或間接的相互影響。但是,細(xì)究某些論文后會(huì)發(fā)現(xiàn),研究者的SEM計(jì)算并沒有聲明數(shù)據(jù)的類型,比如數(shù)據(jù)的一些基本要素,包括正態(tài)性及是否相互獨(dú)立,以及是否存在時(shí)間自相關(guān)等情況;此外研究者也并未聲明采用的是哪種SEM模型進(jìn)行的計(jì)算。不同的SEM模型,對于數(shù)據(jù)的這些基本要素的要求不同,相同數(shù)據(jù)在不同SEM中計(jì)算得出的結(jié)論也許會(huì)有極大的差異。鑒于此,詳細(xì)了解SEM的一些基本理論及適用范圍,將有助于實(shí)現(xiàn)更加科學(xué)的模型計(jì)算,得出的結(jié)論也會(huì)更符合原始數(shù)據(jù)對應(yīng)的生態(tài)學(xué)意義。
這篇文章中,我將了解到:
(1)SEM的基本概念
(2)傳統(tǒng)SEM與分段式SEM的差別(應(yīng)用條件、實(shí)現(xiàn)方法)
(3)有助于理論理解的2個(gè)實(shí)際例子

文中斜體為自己理解的注釋。
非統(tǒng)計(jì)學(xué)專業(yè)翻譯,譯文僅供參考,歡迎批評指正。
轉(zhuǎn)載須獲得作者授權(quán)

原文標(biāo)題:PIECEWISESEM: Piecewise structural equation modelling in R for ecology, evolution, and systematics, Jonathan S. Lefcheck, Methods in Ecology and Evolution 2015.

摘要

1,生態(tài)學(xué)家和進(jìn)化生物學(xué)家依賴著逐漸復(fù)雜的統(tǒng)計(jì)工具來描述復(fù)雜的自然系統(tǒng)。其中有一個(gè)被稱為結(jié)構(gòu)功能模型(SEM)的工具已經(jīng)在生態(tài)學(xué)領(lǐng)域獲得了極大關(guān)注。SEM是一種路徑分析工具,可用來分析解決生態(tài)系統(tǒng)中多種變量之間的復(fù)雜關(guān)系。
2,已有的關(guān)于SEM的計(jì)算是基于變量之間的協(xié)方差,而不是變量的真實(shí)值。雖然這種SEM可以進(jìn)行各種模型的擬合,但是也限制了各種細(xì)節(jié)數(shù)據(jù)的整合。最新發(fā)展的SEM允許使用本地化估算方法同時(shí)實(shí)現(xiàn)正態(tài)-非正態(tài)分布、隨機(jī)效應(yīng)及不同相關(guān)性結(jié)構(gòu)的計(jì)算,但是這種實(shí)現(xiàn)并不能自動(dòng)化計(jì)算,這就限制了在復(fù)雜模型中SEM的計(jì)算。
3,在這里,我開發(fā)了一個(gè)基于R程序語言的開源R包PIECEWISESEM,可用來執(zhí)行確證性路徑分析。這個(gè)包將SEM方法擴(kuò)展到了目前使用的所有線性模型(廣義)、最小二乘模型(系統(tǒng)發(fā)生)以及混合效應(yīng)模型。此外,我還提供了兩個(gè)例子,第一個(gè)涉及到隨機(jī)效應(yīng)和時(shí)間自相關(guān),第二個(gè)涉及到系統(tǒng)發(fā)育的獨(dú)立性比較。
4,我的目標(biāo)是提供一個(gè)用戶友好且易于執(zhí)行的SEM實(shí)現(xiàn)方法,且這種方法能夠體現(xiàn)數(shù)據(jù)生成的生態(tài)學(xué)及方法學(xué)過程。
關(guān)鍵詞:確證性路徑分析,圖形理論,混合模型,網(wǎng)絡(luò)

引言

想要弄明白大自然的錯(cuò)綜復(fù)雜性的欲望,是所有科學(xué)向前發(fā)展的唯一推動(dòng)力。然而,直至上個(gè)世紀(jì)末,生態(tài)學(xué)家及進(jìn)化生物學(xué)家也幾乎只能弄清單個(gè)或少數(shù)幾個(gè)因素對某個(gè)響應(yīng)變量的影響。這種是因?yàn)橛?jì)算能力的限制以及在嚴(yán)謹(jǐn)?shù)膶?shí)驗(yàn)中進(jìn)行簡化的必要性。然而,隨著現(xiàn)代計(jì)算機(jī)的出現(xiàn)以及大尺度觀測變得容易進(jìn)行,使用復(fù)雜工具來處理復(fù)雜自然系統(tǒng)中多方面數(shù)據(jù)集的需求逐漸增加。結(jié)構(gòu)方程模型(SEM)便提供了這樣一種工具。

結(jié)構(gòu)方程模型是一種概率模型,它在一個(gè)因果性網(wǎng)絡(luò)中整合了多個(gè)預(yù)測因子和響應(yīng)變量。模型通常使用路徑圖來進(jìn)行表示,其中箭頭代表觀測變量之間的指向關(guān)系(見Fig.1和2)。這種指向關(guān)系可通過模型中對應(yīng)各個(gè)路徑的一系列結(jié)構(gòu)方程獲得。相較于傳統(tǒng)的建模方法,SEMs具有以下兩個(gè)主要特點(diǎn)。

1. 路徑代表假設(shè)的因果關(guān)系。這其實(shí)違背了那句名言 "相關(guān)性不代表因果性"。事實(shí)上,相關(guān)性確實(shí)意味著因果性,但是因果的方向尚未確定,因?yàn)槿藗儾恢朗茿導(dǎo)致B發(fā)生、還是B導(dǎo)致A發(fā)生或者A和B是第三個(gè)未知變量的結(jié)果。如果使用觀察或者實(shí)驗(yàn)得到的先驗(yàn)知識(shí),人們就能作出有依據(jù)的假設(shè),從而判斷A、B及其它可能影響它們之間關(guān)聯(lián)的變量之間的因果結(jié)構(gòu)。SEM允許直接檢驗(yàn)這些假定的因果結(jié)構(gòu)。從這個(gè)角度來講,因?yàn)镾EM明確地檢驗(yàn)A導(dǎo)致B發(fā)生的這種假設(shè),故其實(shí)際上與傳統(tǒng)的線性模型相背離。關(guān)于以上這種思想的更深入的討論超出了這篇文章的范圍,但是在Pearl(2012)和Bollen&Pearl(2013)的文章中可以找到更多有關(guān)因果性及其與SEM關(guān)系的討論。

2. 變量可同時(shí)作為預(yù)測變量和響應(yīng)變量。通過讓一個(gè)變量在一條路徑中充當(dāng)響應(yīng)變量,并在另一條路徑當(dāng)中充當(dāng)預(yù)測變量,這樣SEM就可以檢驗(yàn)并量化其它單一模型無法實(shí)現(xiàn)的間接或級聯(lián)效應(yīng)(e.g. Grace et al. 2007)。

結(jié)構(gòu)方程模型中需要將生態(tài)學(xué)或進(jìn)化學(xué)問題進(jìn)行結(jié)構(gòu)化并進(jìn)行檢驗(yàn),且在一個(gè)單一網(wǎng)絡(luò)中同時(shí)實(shí)現(xiàn)評估多個(gè)因果假設(shè)。

傳統(tǒng)的SEMs使用最大似然方法來估計(jì)參數(shù)值,這些參數(shù)能最好地重現(xiàn)觀察變量-協(xié)變量矩陣的整體。然后可以使用卡方檢驗(yàn)來評估SEM的擬合優(yōu)度,并于觀察到的協(xié)方差矩陣進(jìn)行比較。然而,這種方法假定所有的觀測獨(dú)立且所有變量服從(多重)正態(tài)分布。此外這種方法還限制了最小觀測次數(shù),因?yàn)檫@種傳統(tǒng)SEM擬合中需要有足夠的自由度來估計(jì)整個(gè)變量-協(xié)變量矩陣(Grace 2006)。

這些限制催生了一種基于圖論應(yīng)用的有向無環(huán)的,或者說分段式的SEMs的并行發(fā)展。首先,在分段式SEM中,將各條路徑圖轉(zhuǎn)換為(結(jié)構(gòu)化的)線性方程集合,并且進(jìn)行獨(dú)立估算。這種將所有方程進(jìn)行同時(shí)計(jì)算的全局估算轉(zhuǎn)換為每個(gè)方程分開計(jì)算的局部估算的處理,會(huì)有利于各種分布(正態(tài)或非正態(tài))及取樣設(shè)計(jì)的數(shù)據(jù)的擬合 (Shipley 2000a, 2009)。此外,理論上來說分段式SEMs還可進(jìn)行更小的數(shù)據(jù)集的擬合,因?yàn)閿M合特定組分模型(可理解為單個(gè)局部估算方程模型)只需要對應(yīng)足夠的自由度便可 (Shipley 2000a)。最后,它可以結(jié)合從分類學(xué)或系統(tǒng)發(fā)育中獲得的進(jìn)化距離來解決共同進(jìn)化史的潛在混淆效應(yīng)(Von Hardenberg & Gonzalez-Voyer 2013)。因?yàn)榉侄问絊EM并沒有合并潛在變量或復(fù)合變量,故我通常把它稱為驗(yàn)證性路徑分析。盡管有這三點(diǎn)不同,但鑒于Grace et al. (2012)將局部估算納入了所謂“第三代SEM”,我還是會(huì)繼續(xù)把這種分段式SEM稱為SEM。

由于分段式SM并不產(chǎn)生有效的全局協(xié)方差矩陣,因此需要進(jìn)行替代性的擬合優(yōu)度檢驗(yàn)。替代的典型方法是使用Shipley的有向分離檢驗(yàn)。這種方法用來檢驗(yàn)所有變量是條件獨(dú)立的這一假設(shè)。說的直白一些,條件獨(dú)立意味著這些未連接的變量間不存在遺失的關(guān)系(指定路徑就存在關(guān)系,不指定的就不存在關(guān)系,F(xiàn)ig.1中的前一年夏季的海藻冠層面積與第二年的波浪擾動(dòng)間就不存在關(guān)系) (Shipley 2000a)。定向分離檢驗(yàn)的第一步,是需要獲得與假設(shè)路徑圖有關(guān)且滿足條件獨(dú)立要求的最小集合,我們稱之為基集。基集可以轉(zhuǎn)化為一個(gè)線性方程組集合,且每一個(gè)線性方程都可以像其它任何線性模型一樣被處理。對于任意一個(gè)給定的獨(dú)立要求的變量的顯著性,也就是p值,都可以估計(jì)且提取??赏ㄟ^結(jié)合方程1所示的統(tǒng)計(jì)檢驗(yàn)(Fisher’s C檢驗(yàn))的基集中的所有p值來進(jìn)行定向分離檢驗(yàn)。

公式1

其中
Pi表示包含k個(gè)變量的基集中的第i個(gè)獨(dú)立變量。
基于這個(gè)公式,C就可以與具有2k個(gè)自由度的卡方分布相比較。當(dāng)有微弱的證據(jù)支持條件獨(dú)立變量之和時(shí),我們假設(shè)的關(guān)系就可看作與數(shù)據(jù)是一致的。公式中得出的C所代表的這些關(guān)系的集合有時(shí)是隨機(jī)的,在這種情況下卡方檢驗(yàn)的P值可能大于我們選擇的顯著性檢驗(yàn)閾值(一般為0.05)。我們可以在Shipley(2000a, 2009)的這些文章中找到關(guān)于基集的推到過程的一些例子。

Shipley (2013)的文章中指出了Fisher’s C統(tǒng)計(jì)檢驗(yàn)可以通過赤池信息準(zhǔn)則的一個(gè)值來獲得,公式如下
AIC=C+2K---公式2
其中
C指公式1中的C,K是自由度的似然值(不要與基集中的獨(dú)立變量數(shù)小k相混淆)。因?yàn)檫@個(gè)估計(jì)值并不是從最大似然數(shù)中獲得,所以這個(gè)K值有時(shí)代表C統(tǒng)計(jì)量信息準(zhǔn)則(CIC,參照 Cardon et al. 2011)。公式2可被擴(kuò)展適用到少樣本(變量)(AICc)的情況中,特別是當(dāng)參數(shù)的個(gè)數(shù)超過了總樣本數(shù)的n/40時(shí),修正的AICc=C+2K(n/(n-K-1))。

分段式SEM的應(yīng)用受限于基集的正確規(guī)范化及估算結(jié)果,且這種應(yīng)用不能手動(dòng)實(shí)現(xiàn),對復(fù)雜模型則更不能實(shí)現(xiàn)了。為解決此問題,我提供了基于R程序語言的完全文檔化且開源的程序包,并命名為PIECEWISESEM。這個(gè)包可實(shí)現(xiàn)分段式SEM的各種計(jì)算,包括構(gòu)建基集、執(zhí)行全體或各組分模型的擬合優(yōu)度檢驗(yàn)、計(jì)算AIC值、返回(標(biāo)準(zhǔn)化的)估計(jì)參數(shù)、繪制局部相關(guān)性以及產(chǎn)生預(yù)測信息。SEMs的構(gòu)建基于一系列的結(jié)構(gòu)方程,這些方程可由R中的大多數(shù)常見的線性建模函數(shù)指定,因此可以實(shí)現(xiàn)正態(tài)-非正態(tài)分布、層次結(jié)構(gòu)以及不同的估計(jì)參數(shù)的計(jì)算。本文中,我給出了兩個(gè)實(shí)際的例子。第一個(gè)結(jié)合了混合效應(yīng)模型及時(shí)間相關(guān)觀測,第二個(gè)涉及到由系統(tǒng)發(fā)育獨(dú)立對比得到的非獨(dú)立性數(shù)據(jù)。執(zhí)行所有這些分析的數(shù)據(jù)和R代碼都可以在文章附件當(dāng)中獲得。

例子1:風(fēng)暴頻率與海藻森林食物網(wǎng)

這個(gè)例子使用的數(shù)據(jù)來自于Byrnes et al. (2011),他們研究了風(fēng)暴事件對美國加利福利亞州海藻森林的多樣性及食物網(wǎng)結(jié)構(gòu)的影響。研究者整合了針對海藻森林的各種生態(tài)學(xué)調(diào)查數(shù)據(jù),包括35個(gè)樣點(diǎn)及八年的基于文獻(xiàn)數(shù)據(jù)的潛在食物網(wǎng)聯(lián)系、基于物理檢測站的波浪高度及頻率數(shù)據(jù)、基于衛(wèi)星圖像的海藻冠層面積數(shù)據(jù)。基于這些數(shù)據(jù),他們使用關(guān)于這一海藻系統(tǒng)的先驗(yàn)知識(shí)以及實(shí)驗(yàn)數(shù)據(jù)(先驗(yàn)知識(shí),也就是已經(jīng)知道特定的因果性是存在的),在一個(gè)單一因果網(wǎng)絡(luò)中匯總了這些變量。然后,他們使用傳統(tǒng)方差-協(xié)方差SEM來估算了這個(gè)模型。

Byrnes et al. 假設(shè)冬季風(fēng)暴產(chǎn)生的波浪擾動(dòng)可能影響已有海藻的數(shù)量,這種數(shù)量會(huì)對春季冠層面積產(chǎn)生交互影響。春季冠層反過來會(huì)影響夏季冠層面積,夏季冠層面積又會(huì)受到物理作用力(指風(fēng)暴)的影響。冠層面積的大小、春季或夏季的季節(jié)變化,都將為諸如藻類、固著底棲無脊椎動(dòng)物以及它們的消費(fèi)者(捕食者)等各種生物提供特殊結(jié)構(gòu)的棲息地。棲息地中總物種豐度,將最終決定我們所觀察到的食物網(wǎng)中潛在營養(yǎng)連接的數(shù)量(或稱連接強(qiáng)度,指每一個(gè)觀測物種對應(yīng)到的捕食關(guān)系的平均數(shù)量)。

上述例子最原始的分析是使用LAVAAN包(Rosseel 2012)執(zhí)行的。模型卡方擬合優(yōu)度檢驗(yàn)的結(jié)果(ka square = 8.784, P = 0.118)顯示數(shù)據(jù)進(jìn)行了充分的擬合。Byrnes et al. (2011)的研究表明,春季冠層面積的大小受到波浪擾動(dòng)及前期冠層面積交互的強(qiáng)烈影響:如果前一年的冠層面積增加,波浪擾動(dòng)對次年春季冠層面積的影響變得更負(fù)相關(guān)。春季冠層面積對物種豐度有著直接的影響,且通過影響夏季冠層面積間接影響著物種豐度。物種豐度又反過來增加了食物網(wǎng)的復(fù)雜性。然而他們注意到,路徑系數(shù)的相乘結(jié)果(0.38×0.29=0.11)顯示,比起間接影響,春季冠層面積對于物種豐度的直接負(fù)向影響的量級更大(標(biāo)準(zhǔn)化β=-0.23)。因此,他們認(rèn)為冬季風(fēng)清除的春季冠層事實(shí)上能夠增加物種豐度(通過減少強(qiáng)烈的直接負(fù)向影響),并最終在短期內(nèi)增加食物網(wǎng)的復(fù)雜性。然而,如果考慮到海藻面積冠層面積降低帶來的影響,那珊瑚礁在受到連續(xù)多年波浪的沖擊后,總物種豐度應(yīng)該降低才對。

Byrnes et al. (2011)的分析中將各觀測數(shù)據(jù)看作是相互獨(dú)立的。然而事實(shí)上,距離較近的觀測點(diǎn)可能具有相同的特征,且在一個(gè)觀測點(diǎn)中,觀測時(shí)間間隔較近的數(shù)據(jù)的相似程度可能高于觀測間隔較遠(yuǎn)的數(shù)據(jù)。為了解決這兩個(gè)問題,我使用分段式SEM重新擬合了他們的原始模型。重新分析的第一步,我將使用NLME包 (Pinheiro et al. 2013)將觀測變量擬合到一般線性混合效應(yīng)模型當(dāng)中,由此解決樣點(diǎn)之間的非獨(dú)立性。雖然也可以使用分段式SEM計(jì)算,當(dāng)我還是將變量進(jìn)行l(wèi)og轉(zhuǎn)化(而不是進(jìn)行整數(shù)擬合)到泊松分布中,以有助于將與原始分析進(jìn)行直接比較。對于每一個(gè)組分模型,我都擬合了樣點(diǎn)的隨機(jī)影響并且只讓模型截距發(fā)生變化。然后我將組分模型整合到一個(gè)串行中,并將串行傳遞給sem.fit函數(shù)。這個(gè)函數(shù)可以返回SEM的定向分離檢驗(yàn)的結(jié)果、Fisher’s C 統(tǒng)計(jì)量和AIC值。接下來,使用sem.coefs函數(shù)來獲得標(biāo)準(zhǔn)化回歸系數(shù)(通過均值和標(biāo)準(zhǔn)誤進(jìn)行標(biāo)準(zhǔn)化,參照Byrnes et al.)。

Fisher’s C統(tǒng)計(jì)量與卡方分布的數(shù)據(jù)比較(C10=15.64,P=0.11)顯示,混合模型的分段式SEM生成的數(shù)據(jù)與 LAVAAN包產(chǎn)生的一致。重新分析的結(jié)果可見于fig1b當(dāng)中。一般情況下,使用sem.model.fits函數(shù)計(jì)算的基于混合和隨機(jī)效應(yīng)的R^2值,分段式SEM模型解釋的方差一般要比傳統(tǒng)SEM的要大。

Fig.1a,b顯示的兩個(gè)模型存在著諸多不同點(diǎn)。首先,即使它們的影響方向不變,前一年海藻冠層面積以及其與波浪擾動(dòng)間的交互作用對于春季冠層面積的影響均減少了2/3。Fig.1b中最重要的結(jié)論是春季冠層面積與物種豐度之間的負(fù)相關(guān)關(guān)系不顯著?;趯哟谓Y(jié)構(gòu)的嵌套觀測結(jié)果,之前認(rèn)為由冠層面積所導(dǎo)致的變異被重新分配到了隨機(jī)(空間)變異當(dāng)中。如此一來,基于分段式SEM的分析結(jié)果便顯示了波浪擾動(dòng)能直接或間接地減少春季冠層面積,從而間接地減少食物網(wǎng)的復(fù)雜性(波浪擾動(dòng)破壞了一連串的正向干擾過程:首先減少了春季和夏季的冠層面積,進(jìn)而減少了物種豐度,并最終降低了食物網(wǎng)的復(fù)雜性)。


Fig.1

第二個(gè)重分析中,我解決了樣點(diǎn)間的非獨(dú)立性及潛在的時(shí)間自相關(guān)問題。步驟為:首先保持與之前一致的隨機(jī)結(jié)構(gòu);然后從NLME包(Pinheiro et al. 2013)的CAR1函數(shù)中,使用一個(gè)連續(xù)自回歸的自相關(guān)結(jié)構(gòu)對樣點(diǎn)年份之間的相關(guān)性進(jìn)行了建模。通過對Fisher’s C統(tǒng)計(jì)量與卡方分布進(jìn)行比較(C8=7.84, P=0.45),我發(fā)現(xiàn)這種分析可以很好地再現(xiàn)數(shù)據(jù)。重分析結(jié)果可見Fig.1c。

與沒有自相關(guān)結(jié)構(gòu)的分段式SEM相比,每個(gè)組分模型的方差解釋量稍微更大一些。但是,兩種分段式模型間的顯著差異較少。春季冠層面積與物種豐度之間的路徑仍然不顯著。夏季冠層面積與波擾動(dòng)之間出現(xiàn)了顯著正相關(guān),而且前一年的冠層面積與物種豐度間的相關(guān)性由顯著變成了不顯著。然而,使用AIC對兩種分段式SEMs進(jìn)行比較后發(fā)現(xiàn),加入CAR1自相關(guān)結(jié)構(gòu)的模型比只加入層次隨機(jī)結(jié)構(gòu)的模型的擬合效果要差 (AICc=97.69 cf. 81.44)(一般而言AIC越小,擬合效果越好)。

總的來說,這種重分析揭示了對于數(shù)據(jù)層次結(jié)構(gòu)的建模,會(huì)使相同原始數(shù)據(jù)出現(xiàn)不同的解釋結(jié)果:波浪擾動(dòng)主要通過清除物種棲息地來降低食物網(wǎng)復(fù)雜性。雖然我的這一結(jié)論支持(Byrnes et al, 2011)的整體結(jié)論:他們的研究認(rèn)為風(fēng)暴事件(比如說波浪擾動(dòng))應(yīng)該會(huì)降低食物網(wǎng)復(fù)雜性,具體過程為重復(fù)不斷的波浪擾動(dòng)事件降低了物種豐度,然后降低了食物網(wǎng)復(fù)雜性;然而我所展示出來的影響過程為,第一次風(fēng)暴擾動(dòng)清除了棲息地,從而降低了食物網(wǎng)的復(fù)雜性(也就是說,兩種模型的主要結(jié)論相似,但是過程解釋不相同)。此外,AIC模型比較顯示,對潛在時(shí)間自相關(guān)進(jìn)行建模并不能增加我們理解這個(gè)相互作用系統(tǒng)的能力。

Byrnes等人(2011)對模型的進(jìn)一步探索發(fā)現(xiàn),將總物種豐度分解為營養(yǎng)成分后,冠層面積的降低顯著減少了藻類數(shù)量,但并不是他們一開始分析的那樣減少了固著無脊椎動(dòng)物或移動(dòng)型消費(fèi)者物種豐度(參照附件數(shù)據(jù))。對樣點(diǎn)的隨機(jī)效應(yīng)建模有可能稀釋了富藻與貧藻樣點(diǎn)間的差異,因此在簡單的分段式SEM中更難觀察到藻類豐度對總物種豐度的貢獻(xiàn) (Fig. 1b,c)。這些進(jìn)一步的分析證實(shí)了對Byrnes等人 (2011)研究工作的深入探索是有必要的,因?yàn)檫@能使統(tǒng)計(jì)學(xué)輸出的結(jié)論能更加符合系統(tǒng)生物學(xué)過程。

海綿蝦的真社會(huì)性及生態(tài)成功學(xué)

在第二個(gè)例子當(dāng)中,我使用來自海綿蝦的一個(gè)屬(Synalpheus)的種群及生態(tài)學(xué)數(shù)據(jù)去探索生態(tài)成功學(xué)(我將ecological success翻譯為生態(tài)成功學(xué),可理解為種群成功占據(jù)了優(yōu)勢生態(tài)位)的驅(qū)動(dòng)因素。這個(gè)屬的物種展示了一系列的社會(huì)結(jié)構(gòu),從成對形成到真社會(huì)性,每個(gè)群體有一個(gè)繁殖的雌性。這些Synalpheus種表現(xiàn)出的復(fù)雜的社會(huì)結(jié)構(gòu)已經(jīng)被假設(shè)為可以有生態(tài)學(xué)上的優(yōu)勢去獲得更強(qiáng)的競爭能力及資源獲取能力(換句話說,真社會(huì)性的物種群落結(jié)構(gòu)可獲得更有利的生態(tài)位,從而從各方面有利于種群的發(fā)展)。為了驗(yàn)證這一假設(shè),Duffy & Macdonald(2010) 整理了Belize地區(qū)20種Synalpheus的雌性體重、寄主種類的數(shù)量(寄主范圍)和單位面積豐度(proportional regional abundance)的數(shù)據(jù)。他們進(jìn)一步計(jì)算了每個(gè)物種的真社會(huì)性指數(shù)。他們假設(shè)群落的真社會(huì)學(xué)物種越多(例如單個(gè)雌性生成更多的后代),群落就會(huì)占據(jù)更廣泛的寄主,并由此會(huì)導(dǎo)致群落會(huì)更容易捍衛(wèi)它們的寄主(類似于領(lǐng)土)(例如在研究區(qū)域內(nèi)達(dá)到更高的群落物種豐度)。此外研究者還假設(shè)寄主范圍可能與物種體型有關(guān),因?yàn)榇蠖鄶?shù)真社會(huì)性物種的體型都比較小。

第一步,我使用LAVAAN包的sem函數(shù)來擬合傳統(tǒng)SEM,并且假定20各數(shù)據(jù)點(diǎn)(物種)是相互獨(dú)立的。模型擬合的數(shù)據(jù)結(jié)果良好(ka^2=0.653,P=0.419),結(jié)果見Fig.2a。有兩條顯著的路徑值得關(guān)注,真社會(huì)性對于基于物種體重的寄主范圍強(qiáng)烈正向影響 (標(biāo)準(zhǔn)化β=0.58),以及寄主范圍對相對豐度的強(qiáng)烈正向影響(0.47)。但是,真社會(huì)性與相對豐度之間并沒有顯著的直接相關(guān)關(guān)系。由此可見,真社會(huì)性物種的成功(占據(jù)生態(tài)位)在極大程度上是由于它們占據(jù)有大范圍的寄主。正因?yàn)檫@些物種占據(jù)了廣泛的棲息地(寄主),因此它們組成了總?cè)郝湄S度的很大一部分。但是這個(gè)模型并不支持這種假設(shè):真社會(huì)性賦予了這些物種直接的優(yōu)勢以幫助物種維持并獲取特殊的生存資源。

當(dāng)然,Duffy & Macdonald (2010)文章中正確指出了這些物種并不獨(dú)立,因?yàn)橐恍┪锓N與其它物種之間相關(guān)性密切。為解決這一問題,我在Fig.1a(原文1a,事實(shí)上應(yīng)該為2a)重新擬合了SEM。此外我還根據(jù)這地區(qū)Synalpheus物種 (Hultgren & Duffy 2012)的系統(tǒng)發(fā)育距離,進(jìn)一步地固定了模型相關(guān)性矩陣。使用APE包(Paradis, Claude & Strimmer 2004)的corBrownian函數(shù),計(jì)算得到來自系統(tǒng)發(fā)育樹的模型相關(guān)性,并且使用NLME包(Pinheiro et al. 2013)中的gls函數(shù)擬合了組分模型。將組分模型存儲(chǔ)在一個(gè)串行數(shù)據(jù)中,然后使用sem.fit函數(shù)計(jì)算了SEM。最終模型計(jì)算得到的數(shù)據(jù)很好(C8=0.57, P=0.751),結(jié)果見Fig. 2b。

Fig.2所示的兩個(gè)SEM有著明顯的差異,其中基于系統(tǒng)發(fā)育的SEM出現(xiàn)了生物量與寄主范圍的顯著負(fù)相關(guān)影響(-0.32),這支持物種尺寸確實(shí)有重要影響這一結(jié)論。即使存在物種尺寸效應(yīng),真社會(huì)性對于寄主范圍仍然有顯著正相關(guān)影響(而且事實(shí)上相關(guān)性指數(shù)更大了,達(dá)到0.80)。和Fig.2a所示的SEM一樣,真社會(huì)性對于單位區(qū)域豐度(% Abundance)并沒有直接影響。同樣地,這種關(guān)系也是通過寄主范圍來調(diào)節(jié)的。使用CAPER包中的pgls函數(shù)重復(fù)以上分析,這個(gè)函數(shù)可以估計(jì)一個(gè)新增的標(biāo)度參數(shù)λ,并產(chǎn)生幾乎一樣的結(jié)果(見附件)。


Fig.2

在Duffy & Macdonald (2010) 的原始文章中,他們使用多元線性回歸來探索這些變量之間的關(guān)系。在考慮了體型和進(jìn)化差異后,他們發(fā)現(xiàn)真社會(huì)性與相對豐度及寄主范圍均有強(qiáng)烈的正相關(guān)關(guān)系。這里,使用SEM對他們的數(shù)據(jù)的進(jìn)行了重分析,我發(fā)現(xiàn)真社會(huì)性與相對豐度之間的關(guān)系并不直接,而是占據(jù)了更廣泛的寄主后的間接影響,且這個(gè)結(jié)論并不能從單個(gè)單獨(dú)的多元回歸中推斷得出。系統(tǒng)發(fā)育方法在SEM中的擴(kuò)充使用,有利于進(jìn)化生態(tài)學(xué)中更加復(fù)雜、多變量假設(shè)數(shù)據(jù)的檢驗(yàn),并且能得到一些重要的觀點(diǎn)。

討論

在本文中,我簡要介紹了分段式SEM的基本概念,并且將分段式SEM應(yīng)用到了兩個(gè)實(shí)際例子當(dāng)中。在兩個(gè)實(shí)例中,我通過引入隨機(jī)變異或進(jìn)化距離,確認(rèn)了數(shù)據(jù)存在非獨(dú)立性,并由此得出了迥異于多重回歸或傳統(tǒng)方差-協(xié)方差SEM的推論。此外我還展示了如何將一個(gè)R包-PIECEWISESEM快速且簡便地應(yīng)用于局部估計(jì)。事實(shí)上,這個(gè)包已被用于探索大葉藻床生態(tài)系統(tǒng)功能的驅(qū)動(dòng)因子 (Duffy et al. 2015),以及研究實(shí)驗(yàn)性河流口岸中尺度生態(tài)系統(tǒng)中不同營養(yǎng)級中功能多樣性的影響因素(Lefcheck & Duffy 2015),以及量化草原功能多樣性的生物及非生物驅(qū)動(dòng)力(Jing et al. 2015)。

------我是分割線------

譯文總結(jié)

1,模型的適用條件上
傳統(tǒng)SEM要求所有變量間相互獨(dú)立,且均為正態(tài)分布;piecewiseSEM則對這些要求不作限制,甚至變量間存在時(shí)間相關(guān)也沒問題。傳統(tǒng)SEM對觀測次數(shù)有最低要求,以使自由度能達(dá)到檢驗(yàn)的最低閾值。
2,模型的實(shí)現(xiàn)手段上
傳統(tǒng)SEM對模型進(jìn)行全局估計(jì),也就是將各變量與其它變量間同時(shí)建立一個(gè)模型,并使用卡方檢驗(yàn)計(jì)算模型擬合參數(shù);
piecewiseSEM需要先構(gòu)建一個(gè)基集,基集中的各組分方程的結(jié)合能擴(kuò)展為原始變量(這類似于線性代數(shù)中的的概念,基中的各向量是線性無關(guān)的,原矩陣的向量可由基中的部分向量組合得到)。
3,模型的評價(jià)參數(shù)上
傳統(tǒng)SEM采用卡方檢驗(yàn),piecewiseSEM采用Fisher's C統(tǒng)計(jì)量。
4,原始數(shù)據(jù)及代碼鏈接
https://besjournals.onlinelibrary.wiley.com/doi/full/10.1111/2041-210X.12512

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容