“?假裝自己是學(xué)霸,像學(xué)霸一樣早起、去圖書(shū)館、去看書(shū),后來(lái),你就成了學(xué)霸!”

文:藍(lán)兔子讀難NOTES
圖: 配圖 來(lái)源于網(wǎng)絡(luò)
編碼:0010
[Quantitative Methods]
[Hypothesis Testing]
金融領(lǐng)域可以說(shuō)既是一個(gè)高門(mén)檻的領(lǐng)域也是一個(gè)低門(mén)檻的領(lǐng)域,說(shuō)其高門(mén)檻,是因?yàn)楦鞣N海歸博士常青藤也只有搬磚的命,說(shuō)其低門(mén)檻是因?yàn)楦舯诶贤醵寄芤贿吺罩茽€一邊玩著股票。
就以股票為例,基本上同小汽車(chē)一般進(jìn)入了尋常百姓家,沒(méi)玩過(guò)股票都不好意思和人一起吹牛。但是正如那句老話所說(shuō),股市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在股票市場(chǎng),既有默不吭聲卻掙得風(fēng)生水起,也有一頓分析猛如狗,一旦開(kāi)盤(pán)反向走的大V反向指標(biāo)。有埋頭專(zhuān)研的技術(shù)流,也有隨風(fēng)招搖的墻頭草。
正所謂磚家一席話,多打十年工。各種各樣的磚家大獅們經(jīng)常瞎帶節(jié)奏,鬼預(yù)測(cè)。今天說(shuō),某某股票明天會(huì)上漲,某某股票明天會(huì)下跌,你要是信了他的邪,最后你就知道什么叫做糟老頭子壞得很了。
但是作為普普通通的我們,有沒(méi)有辦法來(lái)對(duì)這些磚家大V的言論準(zhǔn)確性進(jìn)行檢驗(yàn)?zāi)兀@個(gè)時(shí)候假設(shè)檢驗(yàn)就出場(chǎng)了。

引言
當(dāng)我們對(duì)某一個(gè)具體的值的結(jié)果進(jìn)行預(yù)測(cè)時(shí),比如班上同學(xué)的平均身高,我們實(shí)際上是進(jìn)行了一次假設(shè),我們假設(shè)班上同學(xué)的身高是多少。那我們的假設(shè)是否成立呢?就可以通過(guò)假設(shè)檢驗(yàn)去進(jìn)行驗(yàn)證。
但是現(xiàn)在有一個(gè)問(wèn)題,我們?cè)谶M(jìn)行預(yù)測(cè)時(shí),我們可能假設(shè)平均身高為1.70米,但是經(jīng)過(guò)統(tǒng)計(jì)發(fā)現(xiàn),樣本統(tǒng)計(jì)量的平均身高只有1.6999999米,那怎么來(lái)評(píng)判我們的預(yù)測(cè)是否正確呢?數(shù)據(jù)上來(lái)看,很明顯是不相等的,但是從另外角度來(lái)看,我認(rèn)為完全可以認(rèn)為我們的猜測(cè)是對(duì)的。從統(tǒng)計(jì)學(xué)的角度來(lái)說(shuō),我們每次都是抽取的一個(gè)樣本來(lái)分析的,也許我們永遠(yuǎn)也抽不到一個(gè)和總體均值相等的樣本。那就意味著我們樣本統(tǒng)計(jì)量也許永遠(yuǎn)不會(huì)和總體均值相等。
換句話說(shuō),不能因?yàn)榻y(tǒng)計(jì)結(jié)果和預(yù)測(cè)結(jié)果有差異就判定為預(yù)測(cè)不正確。因此偉大的前輩們提出了另一種思路:我不通過(guò)你對(duì)來(lái)證明你對(duì),但我通過(guò)你不對(duì)來(lái)證明你不對(duì)。我不通過(guò)一件可能會(huì)發(fā)生的事情的發(fā)生來(lái)說(shuō)明啥,但我會(huì)通過(guò)一件不可能發(fā)生的事情的發(fā)生來(lái)說(shuō)點(diǎn)啥,通常,這個(gè)時(shí)候就是說(shuō)點(diǎn)我們之前認(rèn)知有誤的事。

概念
假設(shè)檢驗(yàn)(hypothesis testing)需要區(qū)別于參數(shù)估計(jì)(estimation),后者是對(duì)某一參數(shù)的值的估計(jì),例如全班同學(xué)的身高是多少;而前者,則是要先對(duì)該參數(shù)進(jìn)行假設(shè),而后去判斷假設(shè)得是否正確。在假設(shè)檢驗(yàn)中,我們沒(méi)法正面去判斷假設(shè)是否正確,而是通過(guò)反向的思維去判定其不正確。
假設(shè)檢驗(yàn)的步驟如下:
建立假設(shè) Stating the hypotheses
確定合適的檢驗(yàn)統(tǒng)計(jì)量及其概率分布Identifying the appropriate test statistic and its probability distribution
確定顯著性水平Specifying the significance level
確定拒絕域形式Stating the decision rule
收集數(shù)據(jù),計(jì)算檢驗(yàn)統(tǒng)計(jì)量Collecting the data and calculating the test statistic
做出統(tǒng)計(jì)判斷Making the statistical decision
做出投資決策M(jìn)aking the economic or investment decision
原假設(shè)(Null Hypothesis):就是要被檢驗(yàn)的假設(shè),一般標(biāo)記為H0;
備擇假設(shè)(Alternative Hypothesis):與原假設(shè)相對(duì),標(biāo)記為Ha或者H1,如果原假設(shè)被拒絕,則接受備擇假設(shè)。
假設(shè)檢驗(yàn)形式(Formulations of Hypotheses):
H0: θ = θ0 versus Ha: θ ≠ θ0 (a “not equal to” alternative hypothesis)
H0: θ ≤ θ0 versus Ha: θ > θ0 (a “greater than” alternative hypothesis)
H0: θ ≥ θ0 versus Ha: θ < θ0 (a “l(fā)ess than” alternative hypothesis)
一般等號(hào)放在原假設(shè)。
其中第一種為雙尾檢驗(yàn)(two- sided hypothesis test),第二和第三為單尾檢驗(yàn)(one- sided hypothesis test),判斷單尾還是雙尾檢驗(yàn),就看拒絕域的分布。
檢驗(yàn)統(tǒng)計(jì)量(test statistic)及其分布(distribution):還記得之前的樣本統(tǒng)計(jì)量及其概率分布嗎?假設(shè)檢驗(yàn)也要抽取樣本。不過(guò)不同之處在于,樣本統(tǒng)計(jì)量是用來(lái)估計(jì)總體參數(shù)的,而檢驗(yàn)統(tǒng)計(jì)量則是用來(lái)判斷是否要拒絕原假設(shè)的。假設(shè)檢驗(yàn)量可通過(guò)如下公式計(jì)算:

其中sample statistic就是樣本統(tǒng)計(jì)量,如樣本均值。標(biāo)準(zhǔn)誤我們?cè)趨^(qū)間估計(jì)那一部分內(nèi)容說(shuō)過(guò)。
第一類(lèi)錯(cuò)誤(Type I errors):錯(cuò)殺好人,原假設(shè)對(duì)了,卻被拒絕,這種錯(cuò)誤的概率為α;
第二類(lèi)錯(cuò)誤(Type II errors):放過(guò)壞人,原假設(shè)錯(cuò)了,卻沒(méi)有拒絕,這種錯(cuò)誤的概率為β;
其中,正確接受H0(拒絕Ha)的概率為1-β,又叫做power of test。

顯著性水平(significance level):如之前所說(shuō),假設(shè)檢驗(yàn)是通過(guò)小概率事件不可能發(fā)生來(lái)進(jìn)行檢驗(yàn)的,那多小才算小呢,這就是由顯著性水平來(lái)確定的。顯著性水平其實(shí)類(lèi)似于多小的概率算小概率,在已知樣本統(tǒng)計(jì)量分布的情況下,可以通過(guò)分布查得此顯著性水平對(duì)應(yīng)的標(biāo)準(zhǔn)差范圍,該值就是關(guān)鍵值(critical value)。

在該標(biāo)準(zhǔn)差以外的區(qū)域,即代表著小概率區(qū)域,也就是拒絕域(rejection region)。
如果進(jìn)行一次數(shù)據(jù)收集,經(jīng)過(guò)計(jì)算,結(jié)果落在了拒絕域,也就是落在了小概率區(qū)域,則說(shuō)明小概率事件發(fā)生了,此時(shí)認(rèn)為原假設(shè)存在毛病。
p值(p value),之前的關(guān)鍵值是通過(guò)顯著性水平α查分布表得到的,它與拒絕域的x軸邊界進(jìn)行比較。而p value,是指拒絕原假設(shè)的最小顯著性水平,即當(dāng)P≤α?xí)r,拒絕原假設(shè),是直接對(duì)概率進(jìn)行比較。
統(tǒng)計(jì)顯著(statistical result)與經(jīng)濟(jì)顯著(economically meaningful result),這是因?yàn)樵谶M(jìn)行統(tǒng)計(jì)時(shí),我們沒(méi)有考慮后期的交易和稅費(fèi)等,所以統(tǒng)計(jì)數(shù)據(jù)上看,也許能夠獲得利益,但是實(shí)際上不一定能獲取利益。

正態(tài)總體方差的檢驗(yàn)
檢驗(yàn)統(tǒng)計(jì)方法,這部分內(nèi)容直接記住結(jié)論即可:
均值檢驗(yàn)
單個(gè)正態(tài)總體,方差已知:z分布
單個(gè)正態(tài)總體,方差未知:t分布
兩個(gè)正態(tài)總體,樣本獨(dú)立,方差未知但相等:t檢驗(yàn)
兩個(gè)正態(tài)總體,不獨(dú)立:成對(duì)t檢驗(yàn)
方差檢驗(yàn)
單個(gè)正態(tài)總體:卡方檢驗(yàn)(chi-square)
兩個(gè)正態(tài)總體:F檢驗(yàn)
此處的結(jié)論與我們之前的方差已知用z,方差未知用t相符。
相關(guān)性(correlation)分析的假設(shè),這個(gè)教材后面習(xí)題出現(xiàn)了,記住公式:

t分布,r為相關(guān)系數(shù),n-2為自由度。
最后還有一點(diǎn),參數(shù)檢驗(yàn)(parametric tests)與非參數(shù)檢驗(yàn)(nonparametric test),參數(shù)檢驗(yàn)的特征:
總是與總體參數(shù)有關(guān),如均值、方差;
需假設(shè)總體服從某一特定分布。
非參數(shù)檢驗(yàn)的情形:
無(wú)法進(jìn)行參數(shù)檢驗(yàn),如分布未知或不服從分布;
斯皮爾曼等級(jí)相關(guān)(Spearman Rank Correlation)。
CFA一級(jí)數(shù)量分析-貨幣的時(shí)間價(jià)值
CFA一級(jí)數(shù)量分析-數(shù)理統(tǒng)計(jì)基礎(chǔ)
CFA一級(jí)數(shù)量分析-常見(jiàn)概率分布-下