Lambert2004 空間回歸模型

Lambert DM, Lowenberg-Deboer J, Bongiovanni R (2004) A comparison of four spatial regression models for yield monitor data: A case study from Argentina. Precis Agric 5:579–600. doi: 10.1007/s11119-004-6344-3

數(shù)據(jù)分析和具體地點(diǎn)的建議之間的差距被認(rèn)為是廣泛采用精密農(nóng)業(yè)技術(shù)的主要制約因素之一。這種差異部分是由于可用于理解作物GIS層的分析技術(shù)落后于數(shù)據(jù)收集和存儲(chǔ)技術(shù)的發(fā)展的事實(shí)。產(chǎn)量監(jiān)測(cè),傳感器和其他空間密集的農(nóng)藝數(shù)據(jù)通常是自相關(guān)的,并且鄰近觀測(cè)之間的這種依賴違反了經(jīng)典統(tǒng)計(jì)分析的假設(shè)。因此,估計(jì)的可靠性可能受到損害??臻g回歸分析是更充分地利用空間密集數(shù)據(jù)中包含的信息的一種方式。空間回歸技術(shù)還可以調(diào)整由空間自相關(guān)引起的偏差和無效率。本文的目的是比較四個(gè)空間回歸方法,在可變率技術(shù)的經(jīng)濟(jì)分析中明確納入空間相關(guān)性:(1)從空間計(jì)量經(jīng)濟(jì)學(xué)文獻(xiàn)中采用的回歸方法; (2)多項(xiàng)式趨勢(shì)回歸法; (3)經(jīng)典最近鄰分析;和(4)地統(tǒng)計(jì)方法。分析中使用的數(shù)據(jù)來自1999年阿根廷科爾多瓦省的可變速率氮試驗(yàn)。空間回歸方法提供了比普通最小二乘法更強(qiáng)的對(duì)氮的玉米產(chǎn)量響應(yīng)的空間異質(zhì)性的統(tǒng)計(jì)學(xué)證據(jù)??臻g計(jì)量經(jīng)濟(jì)學(xué)分析可以在相對(duì)較小的數(shù)據(jù)集上實(shí)施,這些數(shù)據(jù)集沒有足夠的觀測(cè)值來估計(jì)地統(tǒng)計(jì)學(xué)所需的半變異函數(shù)。最近鄰和多項(xiàng)式趨勢(shì)分析可以使用GIS軟件中可用的普通最小二乘法來實(shí)現(xiàn)。這項(xiàng)研究的主要結(jié)果是,從這個(gè)可變速率氮試驗(yàn)的邊際分析得出的結(jié)論是相似的每個(gè)空間回歸模型,雖然每個(gè)模型中的空間過程的假設(shè)是完全不同的。


介紹
精確農(nóng)業(yè)(PA)已經(jīng)捕獲了生產(chǎn)者和農(nóng)業(yè)企業(yè)的想象力,但采用相對(duì)較慢。對(duì)于2001年的收獲,約34%的美國(guó)玉米地區(qū)是用裝備有產(chǎn)量監(jiān)測(cè)器的聯(lián)合收割機(jī)收獲的(Daberkow等人,2002),但是這些組合物中只有約三分之一配備有GPS接收器,制作收益率圖。在2000年,大約11%的玉米,6%的大豆和4%的棉花地區(qū)使用可變施肥量施肥。根據(jù)作物,可變播種和農(nóng)藥施用量占地區(qū)面積的1%-3%。 Bullock等人(2002)確定了缺乏特定作物的作物反應(yīng)信息,作為采用空間作物管理實(shí)踐的限制因素。大多數(shù)可變速率輸入應(yīng)用程序仍然基于全場(chǎng)(WF)作物響應(yīng)信息。 Bullock等人認(rèn)為如果生產(chǎn)者可以更容易地收集和分析特定土壤,微氣候和管理區(qū)的作物反應(yīng),則PA可能更有利可圖,使用該技術(shù)改善環(huán)境績(jī)效和食品安全的社會(huì)目標(biāo)可以更多輕松實(shí)現(xiàn)。

文獻(xiàn)中報(bào)道的大部分作物反應(yīng)信息已經(jīng)用普通最小二乘法(OLS)和類似的統(tǒng)計(jì)工具分析。但基于OLS估計(jì)的產(chǎn)量響應(yīng)函數(shù)的可靠性可以通過空間自相關(guān)數(shù)據(jù)進(jìn)行比較(Kessler et al。,1998)。用于農(nóng)藝和農(nóng)場(chǎng)實(shí)驗(yàn)的古典統(tǒng)計(jì)假設(shè)觀察是獨(dú)立的。但是,在PA數(shù)據(jù)的情況下,這種獨(dú)立性的假設(shè)是站不住腳的。例如,任何產(chǎn)量監(jiān)測(cè)觀測(cè)與其相鄰觀測(cè)值明顯相關(guān)。因此,田間異質(zhì)性可能是不成比例的,推斷作物對(duì)變化肥率的反應(yīng)可能會(huì)產(chǎn)生誤導(dǎo)。

農(nóng)場(chǎng)試驗(yàn)研究表明,比較可變速率氮(VRN)與常規(guī)均勻施肥率的實(shí)驗(yàn)分析(Bongiovanni和Lowenberg-DeBoer,2002; Hurley et al。,2004.,Lambert et al。 ,2002)可能導(dǎo)致不準(zhǔn)確的結(jié)論,即哪種輸入管理策略最適合具有不同的,可識(shí)別的管理區(qū)的領(lǐng)域。在這些研究中,當(dāng)考慮空間自相關(guān)時(shí),開發(fā)了可變速率技術(shù)(VRT)獲利性的更可靠的估計(jì)。開發(fā)方法以確定精確農(nóng)業(yè)是否有利可行是一個(gè)關(guān)鍵步驟是開發(fā)一致和可靠的估計(jì)程序,考慮到PA數(shù)據(jù)的空間自相關(guān)性質(zhì)。從經(jīng)濟(jì)角度看,更好的估計(jì)轉(zhuǎn)化為更準(zhǔn)確的評(píng)估特定于站點(diǎn)的管理盈利能力??臻g依賴是一種特殊情況,其中每個(gè)位置的因變量或誤差項(xiàng)與其他位置的因變量或誤差項(xiàng)的觀測(cè)值相關(guān)(Anselin,1992)。在多種背景下(例如,地理學(xué),農(nóng)學(xué),區(qū)域經(jīng)濟(jì)學(xué)和地質(zhì)學(xué))已經(jīng)開發(fā)了模型空間相關(guān)性的回歸方法。本文的主要目的是比較對(duì)VRN的收益率,其中利率是基于使用不同空間回歸技術(shù)估計(jì)的對(duì)氮的現(xiàn)場(chǎng)特定玉米產(chǎn)量響應(yīng)。使用四個(gè)空間回歸模型和普通最小二乘法(OLS)估計(jì)玉米產(chǎn)量反應(yīng)異質(zhì)性。

比較的空間回歸技術(shù)是:(i)限制最大似然(REML)地統(tǒng)計(jì)方法(Cressie,1993; Schabenberger和Pierce,2002); (ii)使用多邊形作為離散觀察單位(或空間自回歸,SAR)的空間回歸方法(Anselin,1988); (iii)多項(xiàng)式趨勢(shì)(PTR)方法(Tamura等人,1988);和(iv)由Papadakis(1937)首先建議的經(jīng)典最近鄰(NN)方法。每種方法不同地建??臻g自相關(guān)??臻g數(shù)據(jù)的估計(jì)技術(shù)之間的差異圍繞著假設(shè)觀測(cè)之間的關(guān)系是否被最好地描述為離散或連續(xù)關(guān)系(關(guān)于這種區(qū)別的細(xì)節(jié),見Anselin,1988)。 SAR和NN方法假定空間相關(guān)性是特定點(diǎn)或多邊形之間的離散關(guān)系。地質(zhì)統(tǒng)計(jì)和PTR方法反映了它們?cè)诜椒ㄖ械钠鹪矗糜谟成浜筒逯?,假定空間結(jié)構(gòu)在空間上是連續(xù)的。

在1999 - 2000年作物季節(jié)數(shù)據(jù)分析中提出的經(jīng)驗(yàn)結(jié)果和部分預(yù)算是使用替代空間回歸方法時(shí)響應(yīng)估計(jì)值有所不同的一個(gè)例子。然而,本案例研究的主要焦點(diǎn)是比較不同模型的空間相關(guān)性的替代回歸方法,以及導(dǎo)出特定位點(diǎn)結(jié)果的方法。方法結(jié)果旨在作為將各種方法應(yīng)用于相同數(shù)據(jù)時(shí)所發(fā)生的情況的示例。結(jié)果是確定方法之間的關(guān)鍵差異的一個(gè)步驟。


理論

  • 近鄰法和空間回歸法(NN)
    農(nóng)業(yè)中的經(jīng)典實(shí)驗(yàn)設(shè)計(jì)是隨機(jī)完全區(qū)塊(RCB)。 RCB設(shè)計(jì)本質(zhì)上是控制實(shí)驗(yàn)誤差的策略。由Fisher在20世紀(jì)20年代開發(fā),RCB被譽(yù)為農(nóng)業(yè)試驗(yàn)中非均勻?qū)嶒?yàn)單位的校正,特別是關(guān)于展示不同土壤類型或排水特性的異質(zhì)景觀。 Papadakis(1937)通過引入最近鄰法(NN)來回應(yīng)費(fèi)舍爾的阻塞方法。在該方法中,從處理塊中的處理j中的子塊i的單個(gè)子塊(y ij)的實(shí)驗(yàn)結(jié)果從母塊的總體處理平均值(y ij)中減去。子塊和整個(gè)塊值之間的差是yij的實(shí)驗(yàn)誤差。在經(jīng)典NN分析中,鄰居被垂直地布置:每個(gè)觀察具有四個(gè)鄰居。因此,y ij的誤差是其四個(gè)相鄰的共享相同邊界的誤差項(xiàng)的平均值。
    Stroup等人(1994)也將NN方法與標(biāo)準(zhǔn)阻斷方法進(jìn)行比較。使用網(wǎng)格實(shí)驗(yàn)設(shè)計(jì),Vollmann et al。 (2000)使用經(jīng)典的NN方法來識(shí)別大豆實(shí)驗(yàn)區(qū)之間的空間模式。他們發(fā)現(xiàn)大豆產(chǎn)量,種子蛋白質(zhì)數(shù)量和種子大小受地塊之間的空間異質(zhì)性的影響。 Helms等人使用的迭代NN方法(1999)比較塊處理和混合誤差手段比較大豆品種的性能。使用方差分析(ANOVA),他們發(fā)現(xiàn)在減少由塊內(nèi)空間異質(zhì)性引起的誤差方面,經(jīng)典阻塞和NN技術(shù)之間沒有什么差別。 NN和經(jīng)典實(shí)驗(yàn)設(shè)計(jì)之間的繪圖方差估計(jì)的精度(純誤差)是相似的。 Brownie et al。 (1993)描述了NN模型:

其中Y是產(chǎn)量,l是總平均產(chǎn)量,sij是處理效果,zij是垂直于yij的最近鄰殘差的集合,h是產(chǎn)量yij和其zij近鄰的殘差之間的協(xié)方差的斜率系數(shù)。殘差誤差表示為rij = yij? ^ Yk,其中^ Yk是處理k的總平均值。 yij的NN殘差的平均值被確定為zij = jri;j≥1+ ji1 + j1j + j + 1; j = 4。 NN模型的結(jié)構(gòu)如(1)中所示,是通常用于測(cè)試農(nóng)場(chǎng)試驗(yàn)的治療差異的熟悉的ANOVA模型的結(jié)構(gòu)。方程(1)可以通過將zij插入到解釋變量的nxk矩陣中而被推廣到熟悉的回歸模型中。這種重新說明是重要的,因?yàn)楸狙芯康闹饕d趣是估計(jì)位點(diǎn)特異性產(chǎn)量反應(yīng)氮(N)。 NN模型變?yōu)閥 = Xb + hz + e,其中協(xié)方差參數(shù)h是殘差的鄰域的平均參數(shù)。等式(1)用OLS估計(jì)。

  • 多項(xiàng)式趨勢(shì)回歸和空間回歸(PTR)
    Tamura et al。 (1988)提出了另一種替代方法,通過在熟悉的ANOVA模型中插入多項(xiàng)式趨勢(shì)變量(Tij)來模擬空間依賴性。這種方法與城市和區(qū)域地理學(xué)中引起注意的空間擴(kuò)展回歸方法有些相關(guān)(Anselin,1988)。趨勢(shì)面被引入到模型中以捕獲觀察之間的空間關(guān)系。這種方法假定省略空間依賴性與經(jīng)濟(jì)計(jì)量文獻(xiàn)中省略的變量問題類似。通過在ANOVA模型中包括趨勢(shì)變量來處理省略的變量問題。像Papadakis提出的NN方法一樣,Tamura等人的PTR模型被開發(fā)以解決未通過常規(guī)阻塞技術(shù)處理的空間結(jié)構(gòu)化誤差過程。利用回歸模型對(duì)多項(xiàng)式響應(yīng)面的同時(shí)估計(jì)將由空間相關(guān)性引起的系統(tǒng)誤差分量與eij的非系統(tǒng)部分分離開(Kirk等人,1980)。參數(shù)估計(jì)只針對(duì)剩余的隨機(jī)分量eij。實(shí)際上,假設(shè)由多項(xiàng)式表達(dá)式指定的趨勢(shì)面具有正確的規(guī)格,則將觀察i與j相關(guān)的坐標(biāo)系添加到以多項(xiàng)式表示的熟悉的回歸模型y = Xb + e中消除了省略的變量問題。所討論的省略的變量將是解釋誤差殘差中的空間結(jié)構(gòu)的變量。 PTR模型指定為
    其中Y為產(chǎn)量,l為總均值,sk為處理效應(yīng),T為多項(xiàng)式趨勢(shì),e為獨(dú)立同分布(i.i.d)隨機(jī)誤差分量。二次趨勢(shì)項(xiàng)估計(jì)為
    其中ui是觀測(cè)值yij的笛卡爾(x,y)坐標(biāo)的斜率系數(shù)。 (x,y)坐標(biāo)表示為行/列對(duì)。與NN方法類似,PTR方法被開發(fā)用于控制空間依賴性的治療效果的ANOVA。在本研究中,目的是確定在空間變化的地形上玉米對(duì)氮的邊際響應(yīng)的差異。為了實(shí)現(xiàn)這個(gè)目標(biāo),PTR模型重寫為,然后用熟悉的回歸估計(jì)
    方程y = xb + e,包括(x,y)坐標(biāo),它們的平方和它們?cè)赬中的相互作用。使用OLS估計(jì)模型。

  • 空間回歸地質(zhì)統(tǒng)計(jì)方法(REML)
    許多農(nóng)學(xué)家使用地球統(tǒng)計(jì)工具來模擬作物和土壤空間關(guān)系。也許這是因?yàn)橥寥揽茖W(xué)與地質(zhì)學(xué)之間的學(xué)科聯(lián)系。最初,地統(tǒng)計(jì)學(xué)被開發(fā)用于通過觀測(cè)之間的插值產(chǎn)生地圖。為了便于繪制,地統(tǒng)計(jì)學(xué)假定空間變異性是由半變異函數(shù)模型化的距離的連續(xù)函數(shù)。在地統(tǒng)計(jì)框架中,在給定點(diǎn)的變量(例如,作物GIS中的層)之間的關(guān)系的推理測(cè)試已經(jīng)發(fā)展相對(duì)最近。 Cressie(1993)介紹了REML地質(zhì)統(tǒng)計(jì)方法。 Little et al。 (1996)和Schabenberger和Pierce(2002)闡述了這種方法,這需要估計(jì)經(jīng)驗(yàn)半變異函數(shù),然后在回歸模型中使用半變異函數(shù)參數(shù)估計(jì)作為先驗(yàn),以表征觀察之間的空間相關(guān)性。 Cressie(1993)和Schabenberger和Pierce(2002)概述的REML地質(zhì)統(tǒng)計(jì)方法已用于分析小麥雜交試驗(yàn)(Stroup等,1994),北卡羅來納州嬰兒猝死綜合征(SIDS)的模式分析(Cressie, 1993)和土壤中的重金屬(Schabenberger和Pierce,2002)。 Lambert et al。 (2002)使用REML地質(zhì)統(tǒng)計(jì)方法來分析產(chǎn)量監(jiān)測(cè)數(shù)據(jù)。 Hurley et al。 (2004)采用了類似的方法結(jié)合地質(zhì)統(tǒng)計(jì)學(xué)和回歸技術(shù)來分析美國(guó)明尼蘇達(dá)州的VRN玉米試驗(yàn)。他們估計(jì)土壤測(cè)試,地形圖和玉米遙感信息的利潤(rùn)率,使用半變異函數(shù)進(jìn)行模型空間誤差過程。 Lark和Wheeler(2003)使用該模型的變體來估計(jì)歐洲的大麥產(chǎn)量響應(yīng)。半變異函數(shù)是REML-地質(zhì)統(tǒng)計(jì)回歸模型的主干。
    半變異函數(shù)參數(shù)(范圍,nugget和sill)被估計(jì),然后用作先驗(yàn)?zāi)P突貧w協(xié)方差矩陣。回歸模型與熟悉的模型y = Xb + e估計(jì),但空間協(xié)方差(R)通過R = Var(e)建模,其中Var(e)
    2 + rs2F,F(xiàn)是N·N矩陣,其第i,j個(gè)元素由距離衰減函數(shù)表征,并且rn2和rs2是核函數(shù)和半變異函數(shù)估計(jì),I是單位矩陣(Little等人, 1996)。 REML參數(shù)估計(jì)是針對(duì)空間自相關(guān)調(diào)整的估計(jì)廣義最小二乘(EGLS)估計(jì)。如果空間相關(guān)性存在于OLS殘差中,則基于OLS和REML模型的對(duì)數(shù)似然性的-2倍的差異的似然比(LR)測(cè)試(v2(2)變量)的零假設(shè)被拒絕et al。,1996)。在本研究中,OLS殘差的魯棒半變異函數(shù)(Cressie,1993)使用SAS中的VARIOGRAM程序(2000)進(jìn)行估計(jì)。在Cressie(1993)之后,使用加權(quán)非線性最小二乘法(WNLS)來估計(jì)OLS殘差的半變異函數(shù)。使用SAS(2000)中的MIXED過程估計(jì)REML回歸。

  • 離散空間回歸法(SAR)
    離散空間回歸方法假定空間依賴是離散觀察或多邊形之間的關(guān)系??臻g結(jié)構(gòu)可以在因變量(例如,產(chǎn)量)或回歸殘差中找到??臻g結(jié)構(gòu)被建模,假設(shè)因變量或殘差是相鄰觀測(cè)值的加權(quán)平均值的函數(shù)。這種方法已廣泛用于流行病學(xué),地理學(xué)和區(qū)域經(jīng)濟(jì)學(xué)。在農(nóng)業(yè)中,數(shù)據(jù)的結(jié)構(gòu)是類似的,但多邊形通常是土壤類型或管理區(qū)域,而不是州,縣,地區(qū)或社區(qū)。這種方法使用多邊形數(shù)據(jù),實(shí)現(xiàn)空間結(jié)構(gòu)的同時(shí)最大似然估計(jì)和GIS層之間的關(guān)系。構(gòu)造空間權(quán)重矩陣以識(shí)別數(shù)據(jù)集中的鄰居。矩陣被設(shè)計(jì)為將諸如重力,熵或衰變的過程并入回歸模型中(Anselin,1988)。以規(guī)則矩形網(wǎng)格排列的數(shù)據(jù)使用三個(gè)標(biāo)準(zhǔn)來定義:“bishop”,“rook”或“queen”。這些類描述了多邊形之間的鄰接級(jí)別或共同邊界。根據(jù)Bongiovanni和Lowenberg-DeBoer(2000),本研究中的SAR回歸使用“皇后”標(biāo)準(zhǔn):?jiǎn)蝹€(gè)網(wǎng)格單元具有與一個(gè)或多個(gè)其他單元共同的邊界和角。在空間術(shù)語(yǔ)中,鄰接性被定義為將一個(gè)細(xì)胞與另一個(gè)細(xì)胞分開的距離的函數(shù)。屬于同一鄰域的塊共享相同的權(quán)重,覆蓋整個(gè)網(wǎng)格的鄰域的復(fù)合定義空間權(quán)重矩陣。該矩陣(W)是N·N,具有元素wij的正定矩陣,以及沿著對(duì)角線的零。在使用空間權(quán)重矩陣來估計(jì)回歸模型中的空間效應(yīng)之前,它們是行標(biāo)準(zhǔn)化的。這有助于比較鄰域的空間特性。行中的每個(gè)元素都由行和除。 Anselin(1988)確定了兩個(gè)一般模式,空間依賴可能表現(xiàn)在回歸分析:空間滯后和空間誤差。如果忽略空間誤差過程,OLS估計(jì)是低效的,但仍然是無偏的。如果忽略空間滯后過程,那么OLS估計(jì)是不一致和有偏差的。當(dāng)與相關(guān)聯(lián)的空間矩陣相關(guān)地估計(jì)回歸模型時(shí),確定這些效應(yīng)的存在。確定空間自相關(guān)的存在的第一步驟需要估計(jì)與相關(guān)聯(lián)的空間矩陣組合的標(biāo)準(zhǔn)OLS模型y = Xb + e。通過將空間權(quán)重矩陣W結(jié)合到回歸模型中,為滯后(誤差)分類確定因變量yi(ei)與相鄰yj(ej)之間的關(guān)系。對(duì)于滯后過程,模型回歸模型變?yōu)閥 = qWy + Xb + e;其中q為相鄰yj的自回歸移動(dòng)平均參數(shù)??臻g誤差模型被指定為y = xb + e,其中e = kWe + u,其中u表示良好行為,非異方差,不相關(guān)的誤差。 bi是對(duì)空間自相關(guān)校正的EGLS估計(jì)。拉格朗日乘數(shù)測(cè)試(LM,作為v2(1)變量分布)可以用于檢測(cè)OLS殘差中空間相關(guān)性的存在。 LMerror測(cè)試的替代方案是殘差遵循空間模式,而LMlag測(cè)試的替代方案是解釋性和/或因變量的個(gè)體觀察與給定鄰域中相同變量的其他值的平均值相關(guān)的觀察。拒絕LMlag測(cè)試的null意味著我們面臨一個(gè)省略的變量問題; OLS估計(jì)是有偏差和不一致的。如果我們拒絕LMerror測(cè)試的null,我們面臨一個(gè)效率問題; OLS估計(jì)沒有偏差,但它們是低效的

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容