- Zas R. Iterative kriging for removing spatial autocorrelation in analysis of forest genetic trials. Tree Genet. Genomes. 2006;2:177–85.
在未充分阻斷的田間基因試驗(yàn)中空間相關(guān)數(shù)據(jù)的常規(guī)分析可能會產(chǎn)生嚴(yán)重影響育種決定的錯(cuò)誤結(jié)果。森林基因試驗(yàn)通常非常大且非常不均勻,因此微環(huán)境異質(zhì)性的調(diào)整變得不可或缺。本研究探討使用地統(tǒng)計(jì)學(xué)來解釋四個(gè)松屬松果Ait的空間自相關(guān)。后代試驗(yàn)建立在丘陵和不規(guī)則的地形,隨機(jī)完全塊設(shè)計(jì)和大塊。使用基于半變異函數(shù)和克里金法的迭代方法調(diào)整在8歲時(shí)評估的5種不同性狀的數(shù)據(jù),并且與常規(guī)分析相比評價(jià)對方差分量,遺傳力和家庭效應(yīng)的估計(jì)的影響。幾乎所有研究的性狀顯示非隨機(jī)空間結(jié)構(gòu)。因此,在對空間自相關(guān)進(jìn)行調(diào)整之后,在常規(guī)分析中非常高的塊和族x塊方差分量幾乎消失。相互作用方差的減少通過家族方差分量恢復(fù),導(dǎo)致更高的遺傳力估計(jì)。空間自相關(guān)的消除也影響家庭效應(yīng)的估計(jì),導(dǎo)致在空間調(diào)整后家庭等級的重要變化。由于家庭效應(yīng)估計(jì)的更高的準(zhǔn)確性,家族之間的比較也大大改善。生長性狀的分析改善較大,其顯示出最強(qiáng)的空間異質(zhì)性,但對于其它性狀如直線性或螺旋數(shù)也是明顯的。本文演示如何空間自相關(guān)可以大幅度影響森林遺傳試驗(yàn)與大塊的分析。本文提出的迭代克里金程序是解決這種空間異質(zhì)性的有前途的工具。
介紹
森林遺傳試驗(yàn)(FGT)通常是非常大的,因?yàn)檫z傳條目的數(shù)量很大并且個(gè)體植物需要大的空間。此外,F(xiàn)GT通常建立在丘陵和不規(guī)則地形上,導(dǎo)致復(fù)制塊內(nèi)的空間異質(zhì)性,這可能限制測試的效率。事實(shí)上,空間梯度和斑塊性已經(jīng)顯示為FGT中的規(guī)范(Costa-Silva等人2001; Dutkowski等人2002; Fu等人1999; Hamann等人2002; Magnussen 1990),甚至在表觀上(Joyce等人,2002年)。當(dāng)存在空間異質(zhì)性時(shí),近鄰相比遠(yuǎn)離近鄰更相似,即,數(shù)據(jù)是自相關(guān)的,并且違反了在標(biāo)準(zhǔn)參數(shù)統(tǒng)計(jì)中的數(shù)據(jù)獨(dú)立性的要求(Legendre 1993)。盡管已經(jīng)表明遺傳試驗(yàn)中空間相關(guān)觀察的常規(guī)分析可能是災(zāi)難性的(Magnussen 1993a),但是在數(shù)據(jù)分析中并入空間相關(guān)性正在慢慢地出現(xiàn)。具有小塊的幾個(gè)復(fù)雜的不完全塊(IB)設(shè)計(jì)可以成功地解釋這種空間異質(zhì)性的大部分(Fu等人1998)。這些實(shí)驗(yàn)設(shè)計(jì)中的一些,如alpha設(shè)計(jì)(Whitaker等人,1999),在最近的森林遺傳試驗(yàn)中已經(jīng)變得流行,但是隨機(jī)化完全區(qū)塊設(shè)計(jì)(RCB)仍然在使用,并且是幾十年前建立的FGT中的典型設(shè)計(jì)(Loo-Dinkins 1992; Magnussen 1993b)。由于FGT的評估必須延遲,以實(shí)現(xiàn)對成熟性能的可靠預(yù)測,仍然有許多森林測試需要RCB和大塊,仍然需要評估。然而,IB設(shè)計(jì)的使用可能無法解釋短距離上的完全空間異質(zhì)性(Magnussen 1990),并且塊邊界和位置變化的實(shí)際模式之間的失配將會發(fā)生,而不管采用何種設(shè)計(jì),因?yàn)榄h(huán)境變化傾向于連續(xù)和平滑(Dutilleul 1993; Dutkowski等人2002; Ettema和Wardle 2002)。植物間競爭可能是老年森林試驗(yàn)的另一個(gè)特殊性,影響鄰居之間的相關(guān)性(Magnussen 1994)。為了最小化不同遺傳項(xiàng)之間的競爭,F(xiàn)GT通常與多樹連續(xù)地塊建立(Magnussen 1993b)。在多樹連續(xù)圖中,基本環(huán)境協(xié)方差與給定圖中的遺傳協(xié)方差混淆,導(dǎo)致偏倚的遺傳參數(shù)估計(jì)和大塊進(jìn)入塊間相互作用方差,這可能大大降低現(xiàn)場測試的精度(Loo -Dinkins 1992)。除了IB設(shè)計(jì),??已經(jīng)提出了幾種分析方法來解釋環(huán)境變化并且提高現(xiàn)場遺傳試驗(yàn)的分析的效率??臻g分析,如趨勢分析,鄰居分析或最近鄰分析,已顯示加強(qiáng)農(nóng)業(yè)田間試驗(yàn)的分析,并在農(nóng)藝學(xué)中變得相當(dāng)普遍(例如,Gilmour等人1997; Grondona等人1996年;喬et al.2000,2004)。雖然沒有如此常用,空間分析方法在森林試驗(yàn)中也給出了成功的結(jié)果(Anekonda和Libby 1996; Costa-Silva等人2001; Dutkowski等人2002; Hamann等人2002; Joyce等人2002; Magnussen 1993a,1994)。
在不同的方法中,地統(tǒng)計(jì)學(xué)已被證明是一種優(yōu)秀的工具來模擬土壤性質(zhì)的空間變化(Gallardo 2003; Gallardo和Covelo 2005;López和Arrúe1995年),并且還去除了遺傳試驗(yàn)中的微環(huán)境異質(zhì)性(Hamann et al.2002)。加利西亞(NW西班牙)是一個(gè)多山和異質(zhì)區(qū)域與酸性和不育森林土壤。該地區(qū)森林種植的生產(chǎn)力高度依賴于土壤性質(zhì)(Merino等人2003;Sánchez-Rodríguez等人2002; Zas和Serrada 2003),其已知具有小規(guī)模空間異質(zhì)性(Gallardo 2003; Gallardo和Covelo 2005)。在四個(gè)RCB松屬pinaster Ait。在加利西亞的后代測試,這種空間異質(zhì)性反映了總方差的大比例解釋塊之間的差異和一個(gè)大的家庭由塊相互作用(Zas et al。2004a)??臻g自相關(guān)在這些試驗(yàn)中似乎是非常重要的,所選擇的材料顯示出極端和不協(xié)調(diào)的環(huán)境敏感性,應(yīng)該進(jìn)一步研究。本研究的目的是1)分析這些后代試驗(yàn)中不同變量的空間結(jié)構(gòu),以及2)評估空間異質(zhì)性對RCB試驗(yàn)常規(guī)統(tǒng)計(jì)分析效率的影響??臻g變異使用半變異函數(shù)和克里金法建模。提出了基于這些技術(shù)的迭代方法以從數(shù)據(jù)中去除空間異質(zhì)性。
空間分析
因?yàn)椴皇撬械臉涿缍及凑找?guī)則網(wǎng)格種植,所以使用在?1:1000尺度的正交航空照片估計(jì)每棵樹的近似x-y坐標(biāo)。容易地鑒定種植系,并且從照片中獲得每條線的開始和結(jié)束的坐標(biāo)。通過用n-1個(gè)等長段中的種植線劃分來確定每條線內(nèi)的樹的坐標(biāo),其中n是給定線中的樹的數(shù)目。減去家族效應(yīng)后每個(gè)變量的殘差用于探索數(shù)據(jù)的空間結(jié)構(gòu)。進(jìn)行單向方差分析,家族效應(yīng)被認(rèn)為是隨機(jī)的,并且使用SAS系統(tǒng)中的MIXED程序(SAS Institute 1999)獲得家族效應(yīng)的最佳線性無偏預(yù)測器(BLUP)。
使用半變異函數(shù)對所得到的殘差的空間結(jié)構(gòu)進(jìn)行建模,其將樹中的半方差作為它們之間的距離的函數(shù)進(jìn)行繪圖(Cressie 1993)。半方差γ(h)計(jì)算為
其中n是由距離h(稱為滯后距離)分離的相鄰樹的對數(shù),z(si)是位于si處的樹的測量的特征值,z(si + h)是位于距離h。對于隨機(jī)分布的數(shù)據(jù),當(dāng)h增加時(shí),將獲得半變化的很小變化,并且半變異函數(shù)將基本上是平的。如果存在空間依賴性,半變異性在短距離上將很小,將在中間距離處增加,并且將在大距離處達(dá)到漸近線(圖1)。實(shí)驗(yàn)半變異函數(shù)使用SAS中的VARIOGRAM程序(Sas Institute,1999)構(gòu)建。使用SAS中的NLIN程序,將指數(shù)理論半變異函數(shù)擬合到實(shí)驗(yàn)半變異函數(shù)中(SAS Institute1999)。該理論半變異函數(shù)用于使用克里金法將殘差的變化劃分為空間自相關(guān)變化和隨機(jī)誤差??死锝鸹谟衫碚摪胱儺惡瘮?shù)定義的空間結(jié)構(gòu)來計(jì)算空間網(wǎng)格上的值的最佳線性無偏預(yù)測的平滑表面。在每個(gè)點(diǎn),克里金估計(jì)的值將被解釋為由于空間位置引起的性狀的量。因此,每個(gè)樹配置的克里金值用于校正每個(gè)變量相對于它們的空間變化的原始值。使用KRIG2D SAS程序(SAS Institute 1999)進(jìn)行克里金分析。
討論
本文提出的結(jié)果表明強(qiáng)烈的空間自相關(guān),可能嚴(yán)重影響數(shù)據(jù)的遺傳分析。如前所述,RCB設(shè)計(jì)的塊結(jié)構(gòu)可能不足以說明這種空間異質(zhì)性,并且常規(guī)統(tǒng)計(jì)分析可能導(dǎo)致錯(cuò)誤方差和家族效應(yīng)估計(jì)(Costa-Silva等人2001; Dutkowski等人2002 ; Hamann等人2002; Joyce等人2002; Magnussen 1993a)。當(dāng)塊大且存在空間依賴性時(shí),需要一些空間分析技術(shù)。本文中使用的迭代克里金程序有效地消除了空間變異,塊和逐塊相互作用方差消失或最終消失。其他空間分析程序,如最近鄰(NN)調(diào)整,已被用于解釋空間異質(zhì)性,但已經(jīng)注意到幾個(gè)關(guān)注點(diǎn)。在NN-協(xié)方差調(diào)整中使用的鄰居數(shù)目(Joyce等人2002)和權(quán)重(Magnussen 1993a)對分析具有重要影響,并且通常是任意定義的??死锝鸱ㄊ褂脤?yīng)于實(shí)際空間依賴性的比率(范圍)內(nèi)的完整信息來執(zhí)行空間結(jié)構(gòu)的無偏估計(jì),并且使用基于點(diǎn)之間的距離和理論半變異函數(shù)(例如, Cressie 1993)。克里金法然后可以被認(rèn)為是NN方法的外推,其中在調(diào)整中使用的鄰居的數(shù)量和權(quán)重從數(shù)據(jù)的實(shí)際空間結(jié)構(gòu)最佳地導(dǎo)出。因此,克里金估計(jì)是特別由于樹位置引起的性狀量的更可靠的指示。如本文所觀察到的,Hamann et al。 (2002),分析三個(gè)紅der木基因試驗(yàn)發(fā)現(xiàn),單個(gè)克里金步驟,去除塊效應(yīng),減少了族間的相互作用,增加了家庭和原產(chǎn)地方差分量,遺傳力相應(yīng)增加。然而,家庭或出生手段的排序沒有改變,在本研究中的P pinaster測試。空間異質(zhì)性的強(qiáng)度越低,由較低的co / cn比率和相對較低的塊方差表示,可以解釋這些差異。 Costa-Silva et al。 (2001),包括統(tǒng)計(jì)分析中的空間相關(guān)殘差,還發(fā)現(xiàn)在幾個(gè)FGT中的遺傳方差的增加和與標(biāo)準(zhǔn)分析相關(guān)的遺傳條目的排名的相對大的變化。 Joyce等人報(bào)道了使用NN方法的類似結(jié)果。 (2002)在黑云杉后代試驗(yàn)中,以及Anekonda和Libby(1996)在紅木的克隆試驗(yàn)中。然而,Magnussen(1993a)使用模擬數(shù)據(jù),發(fā)現(xiàn)空間自相關(guān)人為地增加了多單位地塊設(shè)計(jì)中的遺傳方差和遺傳率。在這些情況下,空間自相關(guān)可能使絕對家庭方差膨脹,因?yàn)閱蝹€(gè)圖中的樹將更相似,但是這應(yīng)當(dāng)通過逐個(gè)塊相互作用方差的增加來清楚地補(bǔ)償(由塊內(nèi)空間異質(zhì)性),導(dǎo)致遺傳力估計(jì)的向下偏差。 Magnussen(1993a)模擬數(shù)據(jù)中的小尺度斑塊結(jié)構(gòu)可能在更大程度上影響家族差異,而不是逐個(gè)家庭的相互作用變量,這將解釋為什么他沒有發(fā)現(xiàn)向下偏差遺傳性估計(jì)。在本研究中,家族方差的絕對值在空間分析后沒有持續(xù)變化,但其相對值有一致的增加(圖5),因此,在遺傳力估計(jì)中(表2) 。家族平均值的預(yù)減法可以偏倚遺傳參數(shù)的估計(jì),因?yàn)榄h(huán)境協(xié)方差可以與家庭成員之間的協(xié)方差混淆,如果一個(gè)家庭發(fā)生在每個(gè)塊中的優(yōu)于平均值的微遺漏中的情況(Joyce等人。2002; Loo- Dinkins 1992)。然而,這可能不會發(fā)生在所有十個(gè)塊的P. pinaster后代試驗(yàn)。這種偏差已被認(rèn)為是在遺傳場數(shù)據(jù)分析中NN調(diào)整的主要約束,但是通過本文提出的迭代過程來克服。在所有塊中的優(yōu)于平均微陣列中出現(xiàn)的家族將在家族發(fā)生的位置周圍的克里金估計(jì)中最初產(chǎn)生向下偏差。然而,家族效應(yīng)的以下估計(jì)將更低,并且這種偏差將趨向于在進(jìn)一步迭代中消失。事實(shí)上,在迭代過程之后殘差的小尺度空間變化對于內(nèi)行和橫行方向沒有差異,如相似的各向異性半變量所示(數(shù)據(jù)未示出)??紤]到方差分量的變化,家族BLUP的準(zhǔn)確性和在第一步之后保持的家族等級,需要迭代過程是明顯的。還可以考慮其他收斂標(biāo)準(zhǔn),如去除的共振的變化或BLUP的精度變化,以完成迭代過程。然而,家族等級的穩(wěn)定性似乎是最嚴(yán)格的標(biāo)準(zhǔn),并且在家族等級穩(wěn)定后,去除的協(xié)方差的變化或BLUP的準(zhǔn)確性不顯著。類似地,Magnussen(1993a)也發(fā)現(xiàn)NN調(diào)整過程的迭代被證明比非迭代調(diào)整更有效。其他作者在兩個(gè)步驟中對空間變化進(jìn)行建模:首先,通過線性回歸來識別行和列中的一般梯度,然后針對小規(guī)??臻g變化探索去趨勢殘差(Fu等人1999; Joyce等人2002 )。盡管這樣的兩步分析在空間變異的表征中可能是有利的(Fu等人1999),在RCB場基因試驗(yàn)的分析中更重要的方面是塊內(nèi)空間異質(zhì)性,即小規(guī)??臻g變化。在一般梯度的情況下,塊設(shè)計(jì)的效率更高。然后應(yīng)將半變異函數(shù)構(gòu)建到與塊大小相似的距離。 Fu et al。 (1999)發(fā)現(xiàn),球面協(xié)方差模型很好地適合于剪影殘差的高度在50個(gè)66道格拉斯杉木后代試驗(yàn),并表明其他方向,而不是行和列的大規(guī)模梯度可能解釋缺乏適合其余網(wǎng)站。如果將原始?xì)埐睿ㄎ慈コ┯糜诎胱儺惡瘮?shù)擬合(如在這種情況下),這些大規(guī)??臻g變化可以通過其他理論函數(shù)來解釋,例如逐漸到達(dá)漸近線的指數(shù)函數(shù)。然而,應(yīng)該嘗試幾種空間模型,并決定哪種模型是最適合的情況。 SAS提供了幾種空間協(xié)方差模型(球形,指數(shù),高斯,線性,功率,嵌套模型等)(SAS研究所,1999)。另一個(gè)問題是,當(dāng)試驗(yàn)分成幾個(gè)不同的區(qū)域時(shí),我們應(yīng)該如何進(jìn)行;這是圖2中的情況。在繪圖邊界附近克里金法的可靠性較小,因?yàn)橛糜诳死锝鸸烙?jì)的鄰居較少,導(dǎo)致克里格估計(jì)的標(biāo)準(zhǔn)誤差較高。因此,克里金法將在分割位置或具有不規(guī)則形狀的位置(邊界附近的樹的比例較高)中表現(xiàn)較差。在幾個(gè)離散區(qū)域的情況下,可以為每個(gè)區(qū)域構(gòu)建單獨(dú)的半變異函數(shù)。在具有本文的離散區(qū)域(位點(diǎn)B和C)的P. pinaster位點(diǎn)中,迭代克里金法似乎是魯棒的,并且使用單獨(dú)的半變異函數(shù)或整個(gè)位點(diǎn)的唯一半變異函數(shù),結(jié)果幾乎相同(數(shù)據(jù)未示出)。然而,在未來的FGT中應(yīng)當(dāng)避免分割位點(diǎn)或具有不規(guī)則形狀的位點(diǎn)以優(yōu)化空間分析技術(shù)的有效性。生長性狀最受空間異質(zhì)性影響,但較少受土壤性質(zhì)變化影響的其他性狀,如直線度和螺旋數(shù),并不完全沒有這種現(xiàn)象。除了可能存在的土壤空間依賴性(del-Ríoet al。2004),主觀評估的性狀可能受到評估者(Sierra de Grado et al。1999)的相對性引起的自相關(guān)性的影響, ,通過提出的空間分析程序有效地去除。如Hamann等人(2002)對于物候特征,當(dāng)存在低空間自相關(guān)時(shí),方差分量和家庭效應(yīng)估計(jì)的減少的變化表明即使在這些情況下應(yīng)用所提出的過程也幾乎沒有什么危害。本文結(jié)果表明空間異質(zhì)性如何可以大大影響FGT的遺傳分析與大塊在丘陵和不規(guī)則的地形。如已經(jīng)指出的(Costa-Silva等人2001; Dutkowski等人2002; Hamann等人2002; Magnussen 1993b,1994),在存在空間自相關(guān)的情況下留下未調(diào)整的數(shù)據(jù)是明顯不可接受的。在不去除空間效應(yīng)的情況下,當(dāng)規(guī)劃高級育種策略和錯(cuò)誤估計(jì)遺傳增益時(shí),錯(cuò)誤方差估計(jì)可能導(dǎo)致不幸的決定。家庭選擇也可以受到強(qiáng)烈影響,因?yàn)樵诳臻g調(diào)整后在家庭等級中觀察到嚴(yán)重的變化。子代試驗(yàn)中用于進(jìn)一步育種的個(gè)體選擇也將被錯(cuò)誤,并且潛在的遺傳收益將丟失。提出的迭代克里金程序是解決空間異質(zhì)性的有前途的工具。雖然這種方法是相當(dāng)艱巨的應(yīng)用,需要很長時(shí)間來完成分析,計(jì)算機(jī)資源的限制不再是障礙,正如幾年前所討論的(Joyce等人2002; Magnussen 1993a),所有的完整可以使用常見的SAS-STAT軟件包(SAS Institute 1999)進(jìn)行空間分析。仍然有許多RCB試驗(yàn)與大塊,在這種空間調(diào)整是至關(guān)重要的。應(yīng)當(dāng)定期檢查半變異函數(shù),以檢驗(yàn)?zāi)P偷臍埐钍欠袷强臻g自相關(guān)的,在這種情況下,強(qiáng)烈建議使用迭代克里金法去除這種空間異質(zhì)性。