狀態(tài)空間模型為時(shí)間序列分析提供了一種靈活的方法,尤其是在簡化最大似然估計(jì)和處理缺失值方面。
結(jié)構(gòu)時(shí)間序列模型(structural time series model)
最基本的一元不可觀測項(xiàng)模型,具有形式

其中,μt,γt和ωt分別表示不可觀測的趨勢項(xiàng)、季節(jié)項(xiàng)、循環(huán)項(xiàng)。et表示不可觀測的不規(guī)則項(xiàng)。在文獻(xiàn)中,通常用非平穩(wěn)(可能帶二重單位根)模型來描述趨勢項(xiàng):

以下內(nèi)容2016.5.8更新
·關(guān)于季節(jié)效應(yīng)(seasonal effect)
在時(shí)間序列分析中,重復(fù)出現(xiàn)的模式被稱為季節(jié)效應(yīng)。當(dāng)時(shí)間序列由每小時(shí)、每天、每月或每季度的觀測值構(gòu)成,則其重復(fù)周期為24(小時(shí))、7(天)、12(月)或者4(季度),這就需要注意時(shí)間序列所存在的季節(jié)效應(yīng)。
在狀態(tài)空間框架下,季節(jié)效應(yīng)可應(yīng)用在局部水平模型或者局部線性趨勢模型中增加季節(jié)成分來建模。
·關(guān)于診斷檢驗(yàn)
線性高斯模型的所有顯著性檢驗(yàn)都基于對三個(gè)殘差假設(shè)的分析。這些殘差應(yīng)當(dāng)滿足如下三個(gè)特性,按重要性依次列出:
(1)獨(dú)立性(independence)
(2)同方差(homoscedasticity)
(3)正態(tài)分布(normality)
先從第一個(gè)也是最重要的假設(shè)開始:獨(dú)立性。殘差的獨(dú)立性假設(shè)可以被Ljung-Box Q統(tǒng)計(jì)量查證。
摘錄一段解釋:
什么是LBQ統(tǒng)計(jì)量?
Ljung-Box q 統(tǒng)計(jì)量用于檢驗(yàn)?zāi)硞€(gè)時(shí)間段內(nèi)的一系列觀測值是不是隨機(jī)的獨(dú)立觀測值。如果觀測值并非彼此獨(dú)立,一個(gè)觀測值可能會在 k 個(gè)時(shí)間單位后與另一個(gè)觀測值相關(guān),形成一種稱為自相關(guān)的關(guān)系。自相關(guān)會削減基于時(shí)間的預(yù)測模型(例如時(shí)間序列圖)的準(zhǔn)確性,并導(dǎo)致數(shù)據(jù)的錯(cuò)誤解釋。
例如,一家電子公司對電池的月銷售量跟蹤記錄五年。他們想使用這些數(shù)據(jù)來設(shè)計(jì)一個(gè)時(shí)間序列模型,以幫助預(yù)測未來的銷售額。但是,月銷售額可能會受季節(jié)趨勢影響。例如,當(dāng)人們?yōu)槭フQ玩具購買電池時(shí),每年這個(gè)時(shí)候的銷售額都會提升。因此某一年的月銷售額觀測值可能會與 12 個(gè)月后(滯后為 12)的月銷售額觀測值相關(guān)。
在選擇時(shí)間序列模型之前,他們可以評估月銷售額差異的自相關(guān)。Ljung-Box Q (LBQ) 統(tǒng)計(jì)量將檢驗(yàn)最多滯后 k 的自相關(guān)等于零的原假設(shè)(即,數(shù)據(jù)值在某一滯后數(shù) — 在本例中為 12 — 之前是隨機(jī)和獨(dú)立的)。如果 LBQ 大于特定臨界值,則一個(gè)或多個(gè)滯后的自相關(guān)可能顯著不同于零,說明在這段時(shí)間內(nèi)各個(gè)值并不是獨(dú)立和隨機(jī)的。
LBQ 還用于在擬合時(shí)間序列模型(例如 ARIMA)后評估假設(shè),以確保殘差彼此獨(dú)立。
Ljung-Box 是一種 Portmanteau 檢驗(yàn),同時(shí)也是 Box-Pierce 卡方統(tǒng)計(jì)量的修訂版。
Q統(tǒng)計(jì)量是一般性總括檢驗(yàn),自相關(guān)分析圖中,用來檢查K階聯(lián)合自相關(guān)系數(shù)是否偏離零值。臨界值為K階的卡方分布臨界值χ2(K;0.05)。若 Q統(tǒng)計(jì)量值大于臨界值,則整個(gè)前K階自相關(guān)系數(shù)估計(jì)值偏離于零,意味著獨(dú)立性的零假設(shè)被拒絕。若觀測值的Q統(tǒng)計(jì)量小于臨界值,則獨(dú)立性的零假設(shè)未被拒絕,即沒有理由假設(shè)殘差存在序列相關(guān)。
獨(dú)立性還可以用殘差的滯后1階自相關(guān)系數(shù)r(1)的值來檢驗(yàn)。其臨界值為95%的置信區(qū)間±2/sqrt(n)。當(dāng)r(1)值在這個(gè)區(qū)間內(nèi)時(shí),則假設(shè)成立,反之被拒絕。
第二個(gè)重要的假設(shè)是殘差的同方差假設(shè)。
在STAMP中,該假設(shè)是由H統(tǒng)計(jì)量來檢驗(yàn)的。我找了好久資料也沒有找到這個(gè)所謂的H統(tǒng)計(jì)量的來源,可能是自己定義的。姑且先不追根溯源,這個(gè)H統(tǒng)計(jì)量檢驗(yàn)殘差的兩個(gè)相同部分的連續(xù)方差是否相等。H(h)的值與F(h,h;0.025)進(jìn)行比較,若H(h)>1,則當(dāng)其小于F值時(shí),假設(shè)成立,反之被拒絕;若H(h)<1,則利用1/H(h)與F值進(jìn)行比較。
P.S. F分布臨界值可以用EXCEL函數(shù)FINV(probability, deg_freedom1, deg_freedom2)計(jì)算。
第三個(gè)重要的假設(shè)是殘差為正態(tài)分布。
在STAMP中,N統(tǒng)計(jì)量檢驗(yàn)殘差分布的偏度和峰度是否符合正態(tài)分布。使用自由度為2的卡方分布來檢驗(yàn)。χ2(2;0.05)=5.99,若N小于這個(gè)值,則零假設(shè)沒有被拒絕,反之被拒絕。