Summary
一個命題的判斷往往不是是非題,真實世界中存在最多的是假設。統(tǒng)計學的假設檢驗在實際生產(chǎn)生活中有很大用處。
- 假設檢驗流程
- 基于Confidence Interval(CI)的假設檢驗
- 決策錯誤
假設檢驗流程
首先,我們從現(xiàn)實情況中提煉出假設命題H0,下標0代表null;
然后,我們找到H0的替代命題HA,下標A代表alternative,也就是統(tǒng)計學中要檢驗的命題;
接著,使用統(tǒng)計學檢驗方法,在假設H0成立的前提下,檢驗統(tǒng)計學上的可能性;
最后,如果檢驗結(jié)果不能有效支持HA成立,那么我們堅持H0的原假設,反之。
作者語:這個思考邏輯不僅在應用統(tǒng)計學時有用,也應該應用在日常生活的決策上。因為人類思維的局限性,我們習慣了二元論的思考方式,非黑即白,非此即彼,但如果能稍微加上一點可能性,就有了黑白之間的灰色地帶,而那使我們?nèi)粘I钏诘牡胤健?/p>
基于Confidence Interval(CI)的假設檢驗
默認顯著性水平為5%,在以H0為真的前提下,計算觀察數(shù)據(jù)符合H0情況的概率。
具體計算過程是:Z值 =(觀察數(shù)據(jù)的平均值-H0的整體平均值)/標準誤差,這里的標準誤差SE = 觀察數(shù)據(jù)的標準偏差SD/ (樣本數(shù)據(jù)量的0.5次冪)。根據(jù)Z值對應查表,得到概率p值。
如果p值低于5%,則H0為真的可能性過低,推翻原假設,證實HA為真;如果p值高于5%,則H0為真的可能性顯著,支持原假設。
作者語:統(tǒng)計學讓常人不舒服的點往往在于不能確定,換用統(tǒng)計學的話來說,使用犧牲precision的方式換得了accuracy。所以,我們判斷一個假設真假的時候也不是絕對的判斷,而是用一個顯著性水平來衡量。
決策錯誤
考慮假設的情況和真實的情況,可能有四種情況:
| 決策 | 決策 | ||
|---|---|---|---|
| 保留H0 | 推翻H0 | ||
| 真相 | H0為真 | 正確 | Type I error |
| 真相 | H0為假 | Type II error | 正確 |
有兩種邏輯上的決策錯誤,Type I是原假設為真卻推翻了原假設,Type II是原假設為假卻放過了原假設。
兩種類型的錯誤此消彼長,都和顯著性水平有關(guān)。我們默認顯著性水平是5%,如果提高這個數(shù)值,我們更容易推翻原假設,這提高了Type I錯誤的概率,反之降低顯著性水平會提高Type II錯誤的概率。
作者語:現(xiàn)實中往往是好事不能得兼的,兩種錯誤在這里是此消彼長的,所以在具體問題中,如何平衡,選擇合適的度是最難的事情。