1 概念
1.1 相關(guān)程度與相關(guān)函數(shù)的聯(lián)系
在概率論和統(tǒng)計(jì)學(xué)中,相關(guān)(Correlation,或稱相關(guān)系數(shù)或關(guān)聯(lián)系數(shù)),顯示兩個(gè)隨機(jī)變量之間線性關(guān)系的強(qiáng)度和方向。在統(tǒng)計(jì)學(xué)中,相關(guān)的意義是用來衡量兩個(gè)變量相對于其相互獨(dú)立的距離。最常用的是皮爾遜積矩相關(guān)系數(shù)。其定義是兩個(gè)變量協(xié)方差除以兩個(gè)變量的標(biāo)準(zhǔn)差(方差的平方根)。
相關(guān)系數(shù)只是一個(gè)比率,不是等單位量度,無什么單位名稱,也不是相關(guān)的百分?jǐn)?shù),一般取小數(shù)點(diǎn)后兩位來表示。相關(guān)系數(shù)的正負(fù)號只表示相關(guān)的方向,絕對值表示相關(guān)的程度。因?yàn)椴皇堑葐挝坏亩攘?,因而不能說相關(guān)系數(shù)0.7是0.35兩倍,只能說相關(guān)系數(shù)為0.7的二列變量相關(guān)程度比相關(guān)系數(shù)為0.35的二列變量相關(guān)程度更為密切和更高。也不能說相關(guān)系數(shù)從0.70到0.80與相關(guān)系數(shù)從0.30到0.40增加的程度一樣大。
對于相關(guān)系數(shù)的大小所表示的意義目前在統(tǒng)計(jì)學(xué)界尚不一致,但通常是這樣認(rèn)為的:
相關(guān)系數(shù) 相關(guān)程度
0.00-±0.30 微相關(guān)
±0.30-±0.50 實(shí)相關(guān)
±0.50-±0.80 顯著相關(guān)
±0.80-±1.00 高度相關(guān)
1.2 互相關(guān)
互相關(guān)(有時(shí)也稱為互協(xié)方差)函數(shù)是信號分析里的概念,表示的是兩個(gè)時(shí)間序列之間的相關(guān)程度,描述信號 x(t),y(t) 在任意兩個(gè)不同時(shí)刻 t1,t2 的取值之間的相關(guān)程度。它是兩個(gè)信號之間相對于時(shí)間的一個(gè)函數(shù),有時(shí)也稱為“滑動(dòng)點(diǎn)積”。這兩個(gè)信號可以是隨機(jī)信號,也可以是確知信號。通常通過與已知信號比較用于尋找未知信號中的特性。
兩個(gè)函數(shù)互相關(guān)的含義是:對兩個(gè)函數(shù)分別作復(fù)數(shù)共軛和反向平移并使其相乘的無窮積分。
性質(zhì):(1)互相關(guān)運(yùn)算一般不服從交換律;(2) 互相關(guān)可以用卷積表示。
個(gè)人理解:(時(shí)間)超前/滯后相關(guān)(time delay analysis / lag regrssion)、時(shí)差相關(guān)(time lag correlation)、互相關(guān)(cross correlation function, ccf)可視為同義語?;ハ嚓P(guān)包含前兩者。(Really?)
2 應(yīng)用:景氣指標(biāo)選擇方法

3 計(jì)算
x,y 分別是兩個(gè)時(shí)間序列,其中 y 為基準(zhǔn)指標(biāo)。
l為超前或滯后期, 被稱為時(shí)差或延遲數(shù) :表示同步;
表示超前;
表示滯后。
n 為所取數(shù)據(jù)的個(gè)數(shù)。
L 表示最大延遲數(shù)。
取不同的值, 分別代表不同的時(shí)差, 并計(jì)算時(shí)差相關(guān)系數(shù)
, 取絕對值最大的
作為時(shí)差相關(guān)系數(shù)。
時(shí)差相關(guān)系數(shù)對應(yīng)的時(shí)差數(shù)的正負(fù), 可判斷被選指標(biāo)與基準(zhǔn)指標(biāo)先行、同步或滯后的關(guān)系。它反映了被選擇指標(biāo)與基準(zhǔn)指標(biāo)的波動(dòng)最接近時(shí)的關(guān)系。只有超前相關(guān)性較強(qiáng)的指標(biāo)才能被選為預(yù)測性指標(biāo)。
4 實(shí)現(xiàn)
(1) Eviews
group里點(diǎn)view-cross correlation
(2) Matlab
xcorr 求序列的自相關(guān)和互相關(guān)。利用Fourier變換中的卷積定理實(shí)現(xiàn)。
c = xcorr(x,y) 返回矢量長度為2*N-1互相關(guān)函數(shù)序列,其中x和y的矢量長度均為N,如果x和y的長度不一樣,則在短的序列后補(bǔ)零直到兩者長度相等。
c = xcorr(x) 為矢量x的自相關(guān)估計(jì)。
c = xcorr(x,y,'option') 為有正規(guī)化選項(xiàng)的互相關(guān)計(jì)算;其中選項(xiàng)為"biased"為有偏的互相關(guān)函數(shù)估計(jì);"unbiased"為無偏的互相關(guān)函數(shù)估計(jì);"coeff"為0延時(shí)的正規(guī)化序列的自相關(guān)計(jì)算,為歸一化選項(xiàng),即互相關(guān)系數(shù)的最大值為1,通常是。其中,
和
分別是信號 x 和 y 的自相關(guān)函數(shù)值;"none"為原始的互相關(guān)計(jì)算。
可以查閱這篇博客了解xcorr函數(shù)的實(shí)現(xiàn)過程:自相關(guān)和互相關(guān)在matlab中的實(shí)現(xiàn)
也可以查閱matlab論壇中教學(xué)直接用FFt變換求兩個(gè)序列互相關(guān)的方法:matlab求兩個(gè)序列的互相關(guān)函數(shù)
corrcoef(x,y)表示序列x和序列y的相關(guān)系數(shù),得到的結(jié)果是一個(gè)2*2矩陣,其中對角線上的元素分別表示x和y的自相關(guān),非對角線上的元素分別表示x與y的相關(guān)系數(shù)和y與x的相關(guān)系數(shù),兩個(gè)是相等的。
(3) Python
計(jì)算時(shí)差相關(guān)系數(shù)
時(shí)間序列數(shù)據(jù)間量化同步的四種方法
用于計(jì)算同步指標(biāo)的示例代碼和數(shù)據(jù)包括:皮爾遜相關(guān),時(shí)間滯后互相關(guān),動(dòng)態(tài)時(shí)間扭曲和瞬時(shí)相位同步。
(4) R
北大數(shù)院講義 Chap 23 多元時(shí)間序列基本概念
ccf 函數(shù)