推論統(tǒng)計學 · 減熵增長(第1篇)

Summary

一個命題的判斷往往不是是非題,真實世界中存在最多的是假設。統(tǒng)計學的假設檢驗在實際生產(chǎn)生活中有很大用處。

  • 假設檢驗流程
  • 基于Confidence Interval(CI)的假設檢驗
  • 決策錯誤

假設檢驗流程

首先,我們從現(xiàn)實情況中提煉出假設命題H0,下標0代表null;
然后,我們找到H0的替代命題HA,下標A代表alternative,也就是統(tǒng)計學中要檢驗的命題;
接著,使用統(tǒng)計學檢驗方法,在假設H0成立的前提下,檢驗統(tǒng)計學上的可能性;
最后,如果檢驗結(jié)果不能有效支持HA成立,那么我們堅持H0的原假設,反之。

作者語:這個思考邏輯不僅在應用統(tǒng)計學時有用,也應該應用在日常生活的決策上。因為人類思維的局限性,我們習慣了二元論的思考方式,非黑即白,非此即彼,但如果能稍微加上一點可能性,就有了黑白之間的灰色地帶,而那使我們?nèi)粘I钏诘牡胤健?/p>

基于Confidence Interval(CI)的假設檢驗

默認顯著性水平為5%,在以H0為真的前提下,計算觀察數(shù)據(jù)符合H0情況的概率。
具體計算過程是:Z值 =(觀察數(shù)據(jù)的平均值-H0的整體平均值)/標準誤差,這里的標準誤差SE = 觀察數(shù)據(jù)的標準偏差SD/ (樣本數(shù)據(jù)量的0.5次冪)。根據(jù)Z值對應查表,得到概率p值。
如果p值低于5%,則H0為真的可能性過低,推翻原假設,證實HA為真;如果p值高于5%,則H0為真的可能性顯著,支持原假設。

作者語:統(tǒng)計學讓常人不舒服的點往往在于不能確定,換用統(tǒng)計學的話來說,使用犧牲precision的方式換得了accuracy。所以,我們判斷一個假設真假的時候也不是絕對的判斷,而是用一個顯著性水平來衡量。

決策錯誤

考慮假設的情況和真實的情況,可能有四種情況:

決策 決策
保留H0 推翻H0
真相 H0為真 正確 Type I error
真相 H0為假 Type II error 正確

有兩種邏輯上的決策錯誤,Type I是原假設為真卻推翻了原假設,Type II是原假設為假卻放過了原假設。
兩種類型的錯誤此消彼長,都和顯著性水平有關(guān)。我們默認顯著性水平是5%,如果提高這個數(shù)值,我們更容易推翻原假設,這提高了Type I錯誤的概率,反之降低顯著性水平會提高Type II錯誤的概率。

作者語:現(xiàn)實中往往是好事不能得兼的,兩種錯誤在這里是此消彼長的,所以在具體問題中,如何平衡,選擇合適的度是最難的事情。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容