[讀書筆記]假設檢驗

目錄

  • 什么是假設檢驗?
  • 假設檢驗的一般步驟
  • 第一類錯誤和第二類錯誤

閱讀本文,需要對抽樣、總體、抽樣分布有一定的了解,可以參考:[讀書筆記] 關于樣本和總體,需要了解哪些?

什么是假設檢驗?

我們通過書中的一個例子,來說明什么是假設檢驗以及為什么需要對假設做檢驗。

例子
某制藥公司宣稱,改公司研發(fā)的一款治療打鼾的藥,可以使患者兩周內的治愈率為90%。某醫(yī)院醫(yī)生,在臨床觀察中抽取了15名患者發(fā)現:兩周治療后,治愈的患者數為11,未治愈患者數為4。根據制藥公司都說法,這15名患者中,應該有14人治愈。現在問題來了,到底該制藥公司發(fā)布的是虛假廣告,還是醫(yī)生抽樣數據有問題?

我們可以對制藥公司的斷言進行檢驗:首先假設制藥公司的斷言屬實,然后出這個斷言出發(fā)對現有的證據進行檢驗,最后做出決策。這個過程,稱為假設檢驗。

假設檢驗的一般步驟

假設檢驗一般分為以下幾個步驟,下來我們分別來看看。

1. 確定要進行檢驗的假設

這里有兩個很重要的概念:原假設和備選假設。原假設是我們要對其進行檢驗的斷言,用H_0表示;與原假設對立的是備選假設,用H_1表示。進行假設檢驗時,假定原假設為真;如果有足夠的證據反駁原假設,則拒絕原假設,接受備選假設。

對于上述的例子,原假設和備選假設分別是:
原假設:藥物能夠在兩周內治愈90%的患者,記作:H_0:p=0.9
備選假設:藥物在兩周內治愈患者少于90%,記作:H_1:p<0.9

2. 選擇檢驗統計量

檢驗統計量即用于進行假設檢驗的統計量,我們根據原假設選擇檢驗統計量?,F在需要對『藥物能夠在兩周內治愈90%的患者』做檢驗,這里檢驗統計量為樣本人數,用X表示。由于X服從二項分布,記作:X \sim B(15,0.9)

3. 確定拒絕域

樣本中,治愈的患者數越少,那么可用于反駁原假設的證據就越有力。但問題是:如何判斷判斷用于反駁的證據足夠有力?這時候就引入了幾個概念:顯著水平、臨界值和拒絕域。下面我們結合下圖來說明。


顯著性水平、臨界值、拒絕域

顯著性水平:希望樣本結果的不可能程度達到多大時,拒絕原假設。這是一個概率值,使用\alpha表示,值通常取5%。(看著好像有點云里霧里)

我們結合上述例子來理解:現在原假設是藥物能夠在兩周內治愈90%的患者,理想情況下治愈人數是90%*15=14。如果說,現在治愈人數小數14人,并且治愈人數越小,我們越有信息否定原假設。至于說治愈人數要多小才能拒絕,這個就是通過顯著性水平來決定。上面說到,顯著性水平是一個概率值,這個概率值對應到樣本的抽樣分布上,會對應一個值c (臨界值),使得P(X<c) < \alpha \quad \alpha=0.05 (拒絕域)。這里的值c就是臨界值,并且治愈人數小于c的概率是0.05。所以說,如果現在抽樣結果是治愈人數小于c,我們就有理由在當前條件下拒絕原假設。

根據備選假設的不同會出現不同方向的拒絕域,拒絕域可能在左尾,也可能在右尾,或者左右都存在。拒絕域是用于拒絕原假設,那反過來理解的話,其實拒絕域就是備選假設的接受域。因此根據備選假設不同,拒絕域也就不同:

備選假設 - 概率小于某個值

單尾檢驗 - 左尾.png

備選假設 - 概率大于某個值

單尾檢驗 - 右尾.png

備選假設 - 概率不等于某個值

雙尾檢驗.png

4. 求出p值

p值是某個小于或者等于拒絕域方向上的一個樣本數值的概率。或者通俗點講:p值是一個概率,這個概率是在假設原假設為真時,你所得到的觀察數據的一個概率。(How often you could get the observed test statistic if the null hypothesis was true. This is the p-value)

仍然以上面的例子為例:在計算中,一般不需要去求c值,只需要根據樣本抽樣分布情況,求出P(X<11)也就是p值即可,(這里的11,是上文提到的醫(yī)生抽樣觀察的結果是11個人治愈,也就是對應樣本中的治愈人數)。例子中,樣本人數服從二項分布,因此可以根據二項分布的概率計算求出p值。

5. 判斷樣本結果是否位于拒絕域中?

判斷是否位于拒絕域中,就是比較p值與α進行比較,所以樣本結果位于拒絕域的條件是:

  • 左尾:p < α
  • 右尾:p < α
  • 雙尾:p < α/2 (有待驗證)
6. 做出決策

根據上一個步驟的計算結果,如果p值落在拒絕域以內,則拒絕原假設,接收備選假設;否則,接受原假設,拒絕備選假設。

第一類錯誤和第二類錯誤

前面介紹了假設檢驗是在某一個顯著性水平下進行的。換句話說,完成檢驗后得出的結論(接受或者否定假設)也不是一個事實,這個結論僅僅也是一個推斷,只不過我們對這個推斷有比較大的信心(概率)相信結論是正確的。既然是推斷,那就有推斷錯誤的時候,這就引出了兩類錯誤:

  • 第一類錯誤:原假設是正確的,但是被錯誤地拒絕了
  • 第二類錯誤:原假設是錯誤的,但是被錯誤地接受了

之所以需要指出第一類和第二類錯誤,是為了引出功效的概念。功效也是一種概率,是原假設錯誤的情況下,拒絕原假設的概率:
功效 = 1 - P(第二類錯誤)

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容