金融時序序列3 - 平穩(wěn)性檢測

3.1 基礎(chǔ) - 時間序列建模

我們從基礎(chǔ)開始吧。 這包括平穩(wěn)序列,隨機(jī)散步,Rho系數(shù),Dickey Fuller Test of Stationarity。 如果這些術(shù)語已經(jīng)嚇到你了,別擔(dān)心 - 他們會變得清楚一點,我敢打賭,你會開始享受這個話題,我會解釋一下。

3.1.1 平穩(wěn)序列

一系列為平穩(wěn)序列的三個基本標(biāo)準(zhǔn):

  • 系列的平均值不應(yīng)該是時間的一個函數(shù),而應(yīng)該是一個常數(shù)。 下面的圖像具有滿足條件的左手圖,而紅色的圖具有時間依賴平均值。


    均值
  • 序列的方差不應(yīng)該是時間的函數(shù)。 這個屬性被稱為同方差。 以下圖表描述了什么是什么,什么不是固定系列。 (注意右側(cè)圖中分布的變化差異)


    同方差和異方差
  • 第i項和第(i + m)項的協(xié)方差不應(yīng)該是時間的函數(shù)。 在下圖中,您將注意到隨著時間的增加,這種差距越來越近。 因此,“紅色系列”的協(xié)方差與時間不一致。


    協(xié)方差

3.1.2 為什么我關(guān)心時間序列的“平穩(wěn)性”?

我首先介紹這個部分的原因是,除非你的時間序列是靜止的,否則你不能建立一個時間序列模型。 在違反固定標(biāo)準(zhǔn)的情況下,首先必須對時間序列進(jìn)行平化,然后嘗試隨機(jī)模型來預(yù)測該時間序列。 有多種方式使這種穩(wěn)定性。

3.1.3 隨機(jī)走

這是時間序列中最基本的概念。 你可能會很了解這個概念。 但是,我發(fā)現(xiàn)很多業(yè)內(nèi)人士將隨機(jī)游走解釋為一個固定的過程。 在這部分借助于一些數(shù)學(xué),我將使這個概念永遠(yuǎn)清晰。 我們來舉個例子。
示例:想象一個女孩隨意移動到一個巨型棋盤上。 在這種情況下,女孩的下一個位置只取決于最后的位置。



現(xiàn)在想象,你坐在另一個房間里,看不到那個女孩。 你想預(yù)測一下女孩的位置。 你會有多準(zhǔn)確? 當(dāng)然,隨著女孩的位置變化,你會變得越來越不準(zhǔn)確。 在t = 0,你確切知道女孩在哪里。 下一次,她只能移動到8個正方形,因此你的概率會下降到1/8而不是1,而且會持續(xù)下降。 現(xiàn)在我們來試一下這個系列:

X(t)= X(t-1)+ Er(t) 

其中Er(t)是時間點t處的誤差。 這是女孩在每個時間點帶來的隨機(jī)性。
現(xiàn)在,如果我們遞歸地適應(yīng)所有的X,我們將終于得到以下等式:

X(t)= X(0)+ Sum(Er(1),Er(2),Er(3)..... Er(t)) 

現(xiàn)在,讓我們嘗試驗證我們對這個隨機(jī)游走公式的固定系列的假設(shè):
平均值是常數(shù)嗎?

E [X(t)] = E [X(0)] + Sum(E [Er(1)],E [Er(2)],E [Er(3t))]) 

我們知道任何錯誤的期望將為零,因為它是隨機(jī)的
因此,我們得到E [X(t)] = E [X(0)] =常數(shù)。
方差是否恒定?

Var [Er(2)],Var [Er(3)] ... Var [X(t)] = Var [X(0)] + Sum(Var [Er(t))]) 
Var [X(t)] = t * Var(Error)=時間依賴。

因此,我們推斷隨機(jī)游走不是一個固定的過程,因為它具有時變方差。 另外,如果我們檢查協(xié)方差,我們也看到這也取決于時間

3.2 引入系數(shù)

我們已經(jīng)知道隨機(jī)游走是一個非平穩(wěn)的過程。 讓我們在方程中引入一個新的系數(shù),看是否可以使方程平穩(wěn)。

3.2.1 引入系數(shù):Rho

 X(t)= Rho * X(t-1)+ Er(t)

現(xiàn)在,我們將

![Uploading image_274132.png . . .]
改變Rho的價值,看看我們能不能使序列穩(wěn)定下來。 在這里,我們將視覺上解釋分散,而不是做任何檢查平穩(wěn)性的測試。
我們從Rho = 0開始一個完全固定的系列。 這是時間序列的情節(jié):



將Rho的值增加到0.5給出如下圖:



您可能會注意到我們的周期變得更廣泛,但基本上似乎并不是嚴(yán)重違反固定假設(shè)。 現(xiàn)在我們來討論一個更極端的Rho = 0.9的情況

我們?nèi)匀豢吹絏在一段時間后從極值返回到零。 這個系列也沒有顯著地違反非平穩(wěn)性。 現(xiàn)在,我們來看看rho = 1的隨機(jī)游走。


這顯然是違規(guī)的。 什么使rho = 1在一個固定測試中出現(xiàn)的特殊情況? 我們會找到數(shù)學(xué)原因。
讓我們對方程“X(t)= Rho * X(t-1)+ Er(t)”的兩邊采取期望。

 E [X(t)] = Rho * E [X(t-1)] 

例如,如果X(t-1)= 1,E [X(t)] = 0.5(Rho = 0.5)。 現(xiàn)在,如果X從0移動到任何方向,則在下一步中將其拉回到零。 唯一可以驅(qū)動它的組件是錯誤的術(shù)語。 錯誤術(shù)語同樣可能在任何一個方向。 當(dāng)Rho變?yōu)?時會發(fā)生什么? 沒有力量可以在下一步中拉下X。

3.2.Augmented Dickey–Fuller test 擴(kuò)展迪基-福勒檢驗

這是檢查平穩(wěn)度的統(tǒng)計測試之一。 這里的零假設(shè)是TS是非平穩(wěn)的。 測試結(jié)果包括測試統(tǒng)計和一些不確定性水平的臨界值。 如果“測試統(tǒng)計”小于“臨界值”,我們可以拒絕零假設(shè),并說系列是的。可以看出這里的拒絕域是{u<u0},這樣代表平穩(wěn),是拒絕域。ADF的零假設(shè)是有一個單位根,替代方法是沒有單位根。 如果p值高于臨界尺寸,那么我們不能拒絕存在單位根。

  1. 測試值高于臨界值,那么存在單位根,接受H0,非平穩(wěn)時間序列
  2. 測試值小于臨界值,那么拒絕H0,接受H1,沒有單位根,平穩(wěn)時間序列
    python中可使用現(xiàn)成的工具statsmodels來實現(xiàn)adf檢驗
dw["ret"] = dw['close'].diff(1)
dw["log"] = np.log(dw['close']).diff(1)
dw.dropna(inplace=True)

result = sts.adfuller(dw["ret"].values, 1)

adf:float
     檢驗統(tǒng)計
p值:float
     MacKinnon基于MacKinnon(1994)的近似p值
usedlag:int
     使用的滯后數(shù)
nobs:int
     用于ADF回歸和計算的觀察數(shù)
     臨界值。
臨界值:dict
     1%,5%和10%的檢驗統(tǒng)計量的關(guān)鍵值
    水平。 基于MacKinnon(2010)
icbest:float
     自動標(biāo)記不是無最大信息標(biāo)準(zhǔn)。

(-13.348425690372366, 
5.7325941497185636e-25, 
0, 
142,
 {'5%': -2.8821181874544233, '1%': -3.4772616240489951, '10%': -2.5777431104939494},
165.84438279201979)

3.3 定階

簡單的理解就是找到時間序列的周期,比如說氣溫這一項,就有明顯的年度周期性,前幾年的同期數(shù)據(jù)對預(yù)測當(dāng)年的氣溫有極大的參考意義。
從統(tǒng)計學(xué)上講就是尋找是得ACF(樣本自相關(guān)系數(shù))最大的時間間隔。
常用定階方法是ACF和PACF。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容