商務(wù)與經(jīng)濟統(tǒng)計第9章

假設(shè)檢驗

1、原假設(shè)和備選假設(shè)的建立

原假設(shè):在假設(shè)檢驗中,我們首先對總體參數(shù)做一個嘗試性的假設(shè)??H_{0} 。

備選假設(shè):定義另一個與院假設(shè)的內(nèi)容完全對立的假設(shè)? H_{\alpha } 。

1)將研究中的假設(shè)設(shè)置為備選假設(shè)的情形

在很多應(yīng)用中都涉及到要通過搜集證據(jù)來支持引入某些新方法或新功能會對現(xiàn)狀有所改善的研究假設(shè),此時可能將備選假設(shè)設(shè)置為研究者期望得到的結(jié)果。更具體地,假設(shè)工程師希望測試一個新開發(fā)的引擎能否實現(xiàn)燃油效率超過 24 英里/加侖,那么此時可以將兩個假設(shè)設(shè)置為:

\bullet 零假設(shè) Null hypothesis:H0: μ ≤ 24

\bullet 備選假設(shè) Alternative hypothesis:Ha: μ > 24

如果通過抽樣得到的燃油效率的均值 ≤ 24,那么此時就將無法拒絕零假設(shè),也即新的設(shè)計并未改善燃油效率。反之,如果抽樣得到的燃油效率的均值 > 24,那么此時可以拒絕零假設(shè)而選擇支持備選假設(shè)。

2)將受到挑戰(zhàn)的假設(shè)作為零假設(shè)

在很多其他的應(yīng)用中,需要研究的對象是對總體的某個特征或參數(shù)的一個假定,此時,一般將這個假定設(shè)置為零假設(shè)。通過假設(shè)檢驗需要實現(xiàn)的是對于這個假定進行挑戰(zhàn),進而確認是否能夠拒絕零假設(shè)而支持備選假設(shè)。更具體地,假設(shè)某個飲料的容量標示為 300 ml,此時假定其標示是正確的,即:

\bullet 零假設(shè) Null hypothesis:H0: μ ≥ 300

\bullet 備選假設(shè) Alternative hypothesis:Ha: μ < 300

如果經(jīng)過抽樣得出的結(jié)論支持零假設(shè),則證明無需采取任何行動。否則,消費者可能會考慮起訴飲料公司。

而從公司經(jīng)營的角度,如果飲料持續(xù)超標準容量罐裝,則會產(chǎn)生額外的生產(chǎn)成本,因此,如果公司需要針對罐裝容量做調(diào)查,則會希望罐裝的均值保持在 300ml左右小范圍波動,即此時的假設(shè)設(shè)定為:

零假設(shè) Null hypothesis:H0= 300

備選假設(shè) Alternative hypothesis:Ha≠ 300

從這個例子中可以看出,即便針對同一個研究對象,不同的出發(fā)點也會導(dǎo)致不同的假設(shè)形式,因此針對具體情景的假設(shè)設(shè)定就顯得非常重要了。

3)、零假設(shè)和備選假設(shè)的一般形式

更一般地,如果令 μ0來代表事先主張的某個值,根據(jù)不同的假設(shè)設(shè)定,零假設(shè)和備選假設(shè)共有三種形式:

H0: μ ≥ μ0,HA: μ < μ0

H0: μ ≤ μ0,HA: μ > μ0

H0: μ = μ0,HA: μ ≠ μ0

值得注意的是,三種形式下相等的部分都發(fā)生在零假設(shè)下,且后續(xù)會知道前兩種形式稱為單尾檢驗,最后一種為雙尾檢驗


2、第一類錯誤與第二類錯誤

理想情況下無論支持或否定零假設(shè)都是基于統(tǒng)計事實的正確決策,但實際情況是由于樣本選取的不同,或者說由于抽樣誤差的存在,我們可能在零假設(shè)本身是正確的情況下選擇了拒絕零假設(shè),轉(zhuǎn)而支持備選假設(shè),當然也存在零假設(shè)原本應(yīng)該被拒絕的情況下錯誤的選擇了支持零假設(shè),這兩類錯誤分別稱為 Type I 錯誤和 Type II 錯誤。I 類錯誤意味著錯誤的拒絕零假設(shè) Type I error of rejecting H0,II 類錯誤意味著錯誤的接受零假設(shè) Type II error of accepting H0。

顯著性水平

當作為一個等式的原假設(shè)為真時,犯第一類錯誤的概率稱為檢驗的顯著性水平。(The level of significance is the probability of making a Type I error by rejecting H_{0} when the null hypothesis is true as an equality.)


3、總體標準差 σ 已知的總體均值的假設(shè)檢驗

再一次地,如果被研究對象的總體服從正態(tài)分布,那么以下假設(shè)檢驗的討論計算結(jié)果都適用,而當總體不服從正態(tài)分布時,如果樣本量足夠大的情況下也同樣適用。

單尾檢驗又分為以下兩種形式:左尾檢驗 Lower tail test 和右尾檢驗 Upper tail test,后續(xù)我們會看到,之所以稱左尾檢驗是在這個檢驗中,我們想要了解的是樣本統(tǒng)計值是否落在某個設(shè)定的臨界值/顯著水平的左側(cè)。同理,針對右尾檢驗,我們需要了解的是樣本統(tǒng)計值是否落在某個設(shè)定的臨界值/顯著水平的右側(cè)。

左尾檢驗 H0: μ ≥ \mu _{0} ,HA: μ < \mu _{0}

右尾檢驗 H0: μ ≤\mu _{0} ,HA: μ > \mu _{0}

舉一個更加具體的例子,假設(shè)一家公司的產(chǎn)品標牌上注明的產(chǎn)品容量是 3 公斤,消費者權(quán)益保護機構(gòu)也認同不可能每一罐產(chǎn)品的容量都絲毫不差的等于 3 公斤,但從保護消費者權(quán)益的角度只要確認總體的均值 μ ≥ 3 公斤即可,這里的 3 就是 \mu _{0} 。此時為了了解產(chǎn)品實際的填充情況,可以建立對“產(chǎn)品罐裝質(zhì)量大于等于 3 公斤”這個假設(shè)的一個檢驗如下:

H_{0} : μ ≥ 3

H_{\alpha } : μ < 3

在選定了假設(shè)檢驗的零假設(shè)和備選假設(shè)后,可以通過對產(chǎn)品進行抽樣,假設(shè)抽樣的產(chǎn)品數(shù)量為 36 罐,如果依據(jù)抽樣的數(shù)據(jù)計算得到的 x? 的值小于 3 公斤,由于樣本差異的存在,我們不能簡單的直接拒絕零假設(shè)。調(diào)查者需要確認的是:到底 x? 小于 3 公斤的程度達到多少時,我們愿意承擔犯第一類錯誤的風險而確定的宣稱罐裝重量的差異應(yīng)該引起重視,或者進一步的采取懲罰行動。在這個決策當中,影響這個差異大小評價的一個重要因素就是顯著水平的高低——也即調(diào)查者愿意承擔的犯第一類錯誤的風險。

本例中調(diào)查人員愿意承擔 1% 的犯第一類錯誤的風險來根據(jù)小于 3 公斤的樣本統(tǒng)計值宣布對于這家公司進行處罰,也即 α = 0.01。

檢驗統(tǒng)計量 Test statistic 及其選擇

繼續(xù)上面的例子,在抽樣完成后,如果假定由于對這家公司長期的監(jiān)督中發(fā)現(xiàn)其總體的均方差 σ = 0.18,且灌裝質(zhì)量總體上服從正態(tài)分布,那么抽樣得到的 x? 的抽樣分布將服從均值為總體均值 μ,均方誤差為 \sigma _{\bar{x} } = \frac{\sigma }{n^{1/2} } 的正態(tài)分布,在本例中 μ = \mu _{0} =3,\sigma _{\bar{x} } = 0.03。此時,我們可以通過計算標準值? z = (x? - μ) / \sigma _{\bar{x} } \來了解在服從前面這個抽樣分布的前提下,抽樣得到某個 x? 取值的概率。在后續(xù)可以知道,由于統(tǒng)計在檢驗中使用 z 這個統(tǒng)計值可以判定檢驗的結(jié)果,在這里 z 被稱為檢驗統(tǒng)計量。

在獲取了這個檢驗統(tǒng)計量以后,我們可以通過以下兩種方法得到檢驗的結(jié)論:

p-value 法:

前面已經(jīng)講到,對于總體均值的左尾檢驗來說,在零假設(shè)中期望總體的均值應(yīng)該是超過某個假設(shè)值的,但由于抽樣誤差的存在,我們可能會得到一個小于假設(shè)值的 x?,此時必須要回答的一個問題就是,當這個 x? 與假設(shè)值左偏多少時,我們愿意承擔一定的風險來拒絕零假設(shè)。

在已經(jīng)獲得 z 這個檢驗統(tǒng)計量后,可以根據(jù)標準正態(tài)分布表查取取得這個 z 值的概率,并將這個概率值稱為 p-value。如果對應(yīng)的 p-value 很小,則意味著在服從前述假設(shè)前提的概率分布的樣本中取得這個 x? 的概率很小,這意味著零假設(shè) H0這個前提很可能是有問題的。此時如果我們已經(jīng)設(shè)定好了顯著水平 α,即在零假設(shè)正確的前提下拒絕零假設(shè)的概率,并且發(fā)現(xiàn) p-value 小于這個顯著水平,那么我們可以更加確信的拒絕 H0。

回到這個具體的例子,假設(shè)我們得到的 x? = 2.92,則其 z = (2.92 - 3) / 0.03 = -2.67,對應(yīng)標準正態(tài)分布中取得這個 z 值或比其更小的 z 值的概率為 0.0038,這意味這我們從一個均值為 3,均方誤差為 0.03 的正態(tài)分布中取得 x? = 2.92 或更小值的概率為 P(x ≤ 2.92) = 0.0038。

前面由于已經(jīng)知道管理者愿意承擔的第一類錯誤的風險值為 α = 0.01,此時由于 p-value = 0.0038 遠小于這個值,據(jù)此可以更加確定地拒絕零假設(shè)。

更一般地,在左尾檢驗中,如果在假設(shè)檢驗中得到的 p-value 小于等于顯著水平 α,我們就可以拒絕零假設(shè)。由于 p-value 來自于對總體的一個觀測,對于任意小于等于 α 的 p-value,我們都會拒絕零假設(shè),因此 p-value 也被稱為觀測到得顯著水平。

臨界值法 :

臨界值法要求我們?yōu)闄z驗統(tǒng)計量設(shè)定一個臨界值,對于左尾檢驗來說,如果檢驗統(tǒng)計量小于臨界值,那么就可以拒絕零假設(shè)。如果理解了顯著水平這個定義,由于其就是對應(yīng)標準正態(tài)分布中 z 取得某個值左側(cè)部分的概率值,這個值也就是這里的臨界值,也即 α = P(z ≤ 臨界值) 。

在臨界值法進行左尾檢驗中,如果事先已經(jīng)設(shè)定了顯著水平,則可以根據(jù)標準正態(tài)分布表查取取得這個臨界值及其左側(cè)部分的概率為 α 時對應(yīng)的 zα值,然后用這個值和檢驗統(tǒng)計得到的 zx?進行對比,如果 zx?≤ zα那么則可以拒絕零假設(shè)。

從上述計算過程可知,p-value 法和臨界值法是基于同一個原理,也即在抽樣中,符合一定條件的抽樣分布服從正態(tài)分布,在此基礎(chǔ)上 α 就是樣本統(tǒng)計值取在某個臨界點及其左側(cè)區(qū)域內(nèi)的概率值,此時:

\bullet 從樣本統(tǒng)計得到的 zx?值可以通過計算概率來和 α 做對比

\bullet 通過顯著水平 α 計算臨界值 zα來和 zx?做對比

上面的討論是針對左尾檢驗來說的,根據(jù) p-value 的定義,在實際應(yīng)用中有:

\bullet 左尾檢驗:考察的是總體的均值是否大于等于某個假設(shè),p-value 的值等于取得某個 zx?值為界限的正態(tài)分布曲線左側(cè)部分的面積或者說概率,也即 p-value = P(z ≤ z_{\bar{x} } ),相應(yīng)的拒絕零假設(shè)的條件是 p-value ≤ α 或 z_{\bar{x} } ≤? z_{\alpha  }

\bullet 右尾檢驗:考察的是總體的均值是否小于等于某個假設(shè),p-value 的值等于取得某個 zx?值為界限的正態(tài)分布曲線右側(cè)部分的面積或者說概率,也即 p-value = 1 - P(z ≤ z_{\bar{x} } ),相應(yīng)的拒絕零假設(shè)的條件是 p-value ≤ α 或 z_{\bar{x} } z_{\alpha  }

雙尾檢驗

多時候我們需要被研究對象的某個特征固定在某個假設(shè)的取值附近,既不能太大,也不能太小。此時如果采用抽樣的形式對于總體的特征參數(shù)進行研究時,有的樣本的均值的取值會大于這個假設(shè)的取值,有的樣本的均值的取值會小于這個假設(shè)的取值,也即抽樣得到的均值的取值圍繞設(shè)定值左右波動,那么如何有依據(jù)的評價這個波動的大小進而拒絕這個假設(shè)還是不拒絕這個假設(shè)就需要采用雙尾檢驗。其零假設(shè)和備選假設(shè)的一般形式為:

H_{0} : μ = \mu _{0} ,H_{\alpha } : μ ≠ \mu _{0}

再一次地,這個評價的依據(jù)就是選擇好的顯著性水平 α,只不過與單尾檢驗最重要的區(qū)別在于,α 對應(yīng)的概率值被平均分配為正態(tài)分布的左右兩側(cè) z_{\alpha /2} 面積下的概率,其目的是考察抽樣統(tǒng)計值圍繞事先設(shè)定的假設(shè)值的左右偏離程度。相應(yīng)的 p-value 也是取得檢驗統(tǒng)計值及其相反數(shù)的正態(tài)分布兩側(cè)的概率,并且當 P(z ≥ z_{\bar{x} } ) + P(z ≤ -z_{\bar{x} } ) ≤ α 時拒絕零假設(shè),或者當采用臨界值法時樣本統(tǒng)計值 z ≥ z_{\alpha /2} 或 z ≤ -z_{\alpha /2} 可以認為在服從前述假設(shè)分布的情況下取得這個 z 值是小概率事件,也可以拒絕零假設(shè)。

至此,對于總體均方差已知的情況下對于總體均值的假設(shè)檢驗的討論就結(jié)束了,總結(jié)前面的內(nèi)容如下:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容