假設(shè)檢驗

1、原假設(shè)和備選假設(shè)的建立

原假設(shè)：在假設(shè)檢驗中，我們首先對總體參數(shù)做一個嘗試性的假設(shè)?? $H_{0}$ 。

備選假設(shè)：定義另一個與院假設(shè)的內(nèi)容完全對立的假設(shè)? $H_{\alpha }$ 。

1）將研究中的假設(shè)設(shè)置為備選假設(shè)的情形

在很多應(yīng)用中都涉及到要通過搜集證據(jù)來支持引入某些新方法或新功能會對現(xiàn)狀有所改善的研究假設(shè)，此時可能將備選假設(shè)設(shè)置為研究者期望得到的結(jié)果。更具體地，假設(shè)工程師希望測試一個新開發(fā)的引擎能否實現(xiàn)燃油效率超過 24 英里/加侖，那么此時可以將兩個假設(shè)設(shè)置為：

$\bullet$ 零假設(shè) Null hypothesis：H0: μ ≤ 24

$\bullet$ 備選假設(shè) Alternative hypothesis：Ha: μ > 24

如果通過抽樣得到的燃油效率的均值 ≤ 24，那么此時就將無法拒絕零假設(shè)，也即新的設(shè)計并未改善燃油效率。反之，如果抽樣得到的燃油效率的均值 > 24，那么此時可以拒絕零假設(shè)而選擇支持備選假設(shè)。

2）將受到挑戰(zhàn)的假設(shè)作為零假設(shè)

在很多其他的應(yīng)用中，需要研究的對象是對總體的某個特征或參數(shù)的一個假定，此時，一般將這個假定設(shè)置為零假設(shè)。通過假設(shè)檢驗需要實現(xiàn)的是對于這個假定進行挑戰(zhàn)，進而確認是否能夠拒絕零假設(shè)而支持備選假設(shè)。更具體地，假設(shè)某個飲料的容量標示為 300 ml，此時假定其標示是正確的，即：

$\bullet$ 零假設(shè) Null hypothesis：H0: μ ≥ 300

$\bullet$ 備選假設(shè) Alternative hypothesis：Ha: μ < 300

如果經(jīng)過抽樣得出的結(jié)論支持零假設(shè)，則證明無需采取任何行動。否則，消費者可能會考慮起訴飲料公司。

而從公司經(jīng)營的角度，如果飲料持續(xù)超標準容量罐裝，則會產(chǎn)生額外的生產(chǎn)成本，因此，如果公司需要針對罐裝容量做調(diào)查，則會希望罐裝的均值保持在 300ml左右小范圍波動，即此時的假設(shè)設(shè)定為：

零假設(shè) Null hypothesis：H0= 300

備選假設(shè) Alternative hypothesis：Ha≠ 300

從這個例子中可以看出，即便針對同一個研究對象，不同的出發(fā)點也會導(dǎo)致不同的假設(shè)形式，因此針對具體情景的假設(shè)設(shè)定就顯得非常重要了。

3）、零假設(shè)和備選假設(shè)的一般形式

更一般地，如果令 μ0來代表事先主張的某個值，根據(jù)不同的假設(shè)設(shè)定，零假設(shè)和備選假設(shè)共有三種形式：

H0: μ ≥ μ0，HA: μ < μ0

H0: μ ≤ μ0，HA: μ > μ0

H0: μ = μ0，HA: μ ≠ μ0

值得注意的是，三種形式下相等的部分都發(fā)生在零假設(shè)下，且后續(xù)會知道前兩種形式稱為單尾檢驗，最后一種為雙尾檢驗

2、第一類錯誤與第二類錯誤

理想情況下無論支持或否定零假設(shè)都是基于統(tǒng)計事實的正確決策，但實際情況是由于樣本選取的不同，或者說由于抽樣誤差的存在，我們可能在零假設(shè)本身是正確的情況下選擇了拒絕零假設(shè)，轉(zhuǎn)而支持備選假設(shè)，當然也存在零假設(shè)原本應(yīng)該被拒絕的情況下錯誤的選擇了支持零假設(shè)，這兩類錯誤分別稱為 Type I 錯誤和 Type II 錯誤。I 類錯誤意味著錯誤的拒絕零假設(shè) Type I error of rejecting H0，II 類錯誤意味著錯誤的接受零假設(shè) Type II error of accepting H0。

顯著性水平

當作為一個等式的原假設(shè)為真時，犯第一類錯誤的概率稱為檢驗的顯著性水平。（The level of significance is the probability of making a Type I error by rejecting $H_{0}$ when the null hypothesis is true as an equality.）

3、總體標準差 σ 已知的總體均值的假設(shè)檢驗

再一次地，如果被研究對象的總體服從正態(tài)分布，那么以下假設(shè)檢驗的討論計算結(jié)果都適用，而當總體不服從正態(tài)分布時，如果樣本量足夠大的情況下也同樣適用。

單尾檢驗又分為以下兩種形式：左尾檢驗 Lower tail test 和右尾檢驗 Upper tail test，后續(xù)我們會看到，之所以稱左尾檢驗是在這個檢驗中，我們想要了解的是樣本統(tǒng)計值是否落在某個設(shè)定的臨界值/顯著水平的左側(cè)。同理，針對右尾檢驗，我們需要了解的是樣本統(tǒng)計值是否落在某個設(shè)定的臨界值/顯著水平的右側(cè)。

左尾檢驗 H0: μ ≥ $\mu _{0}$ ，HA: μ < $\mu _{0}$

右尾檢驗 H0: μ ≤ $\mu _{0}$ ，HA: μ > $\mu _{0}$

舉一個更加具體的例子，假設(shè)一家公司的產(chǎn)品標牌上注明的產(chǎn)品容量是 3 公斤，消費者權(quán)益保護機構(gòu)也認同不可能每一罐產(chǎn)品的容量都絲毫不差的等于 3 公斤，但從保護消費者權(quán)益的角度只要確認總體的均值 μ ≥ 3 公斤即可，這里的 3 就是 $\mu _{0}$ 。此時為了了解產(chǎn)品實際的填充情況，可以建立對“產(chǎn)品罐裝質(zhì)量大于等于 3 公斤”這個假設(shè)的一個檢驗如下：

$H_{0}$ : μ ≥ 3

$H_{\alpha }$ : μ < 3

在選定了假設(shè)檢驗的零假設(shè)和備選假設(shè)后，可以通過對產(chǎn)品進行抽樣，假設(shè)抽樣的產(chǎn)品數(shù)量為 36 罐，如果依據(jù)抽樣的數(shù)據(jù)計算得到的 x? 的值小于 3 公斤，由于樣本差異的存在，我們不能簡單的直接拒絕零假設(shè)。調(diào)查者需要確認的是：到底 x? 小于 3 公斤的程度達到多少時，我們愿意承擔犯第一類錯誤的風險而確定的宣稱罐裝重量的差異應(yīng)該引起重視，或者進一步的采取懲罰行動。在這個決策當中，影響這個差異大小評價的一個重要因素就是顯著水平的高低——也即調(diào)查者愿意承擔的犯第一類錯誤的風險。

本例中調(diào)查人員愿意承擔 1% 的犯第一類錯誤的風險來根據(jù)小于 3 公斤的樣本統(tǒng)計值宣布對于這家公司進行處罰，也即 α = 0.01。

檢驗統(tǒng)計量 Test statistic 及其選擇

繼續(xù)上面的例子，在抽樣完成后，如果假定由于對這家公司長期的監(jiān)督中發(fā)現(xiàn)其總體的均方差 σ = 0.18，且灌裝質(zhì)量總體上服從正態(tài)分布，那么抽樣得到的 x? 的抽樣分布將服從均值為總體均值 μ，均方誤差為 $\sigma _{\bar{x} }$ = $\frac{\sigma }{n^{1/2} }$ 的正態(tài)分布，在本例中 μ = $\mu _{0}$ =3， $\sigma _{\bar{x} }$ = 0.03。此時，我們可以通過計算標準值? z = (x? - μ) / $\sigma _{\bar{x} } \$ 來了解在服從前面這個抽樣分布的前提下，抽樣得到某個 x? 取值的概率。在后續(xù)可以知道，由于統(tǒng)計在檢驗中使用 z 這個統(tǒng)計值可以判定檢驗的結(jié)果，在這里 z 被稱為檢驗統(tǒng)計量。

在獲取了這個檢驗統(tǒng)計量以后，我們可以通過以下兩種方法得到檢驗的結(jié)論：

p-value 法：

前面已經(jīng)講到，對于總體均值的左尾檢驗來說，在零假設(shè)中期望總體的均值應(yīng)該是超過某個假設(shè)值的，但由于抽樣誤差的存在，我們可能會得到一個小于假設(shè)值的 x?，此時必須要回答的一個問題就是，當這個 x? 與假設(shè)值左偏多少時，我們愿意承擔一定的風險來拒絕零假設(shè)。

在已經(jīng)獲得 z 這個檢驗統(tǒng)計量后，可以根據(jù)標準正態(tài)分布表查取取得這個 z 值的概率，并將這個概率值稱為 p-value。如果對應(yīng)的 p-value 很小，則意味著在服從前述假設(shè)前提的概率分布的樣本中取得這個 x? 的概率很小，這意味著零假設(shè) H0這個前提很可能是有問題的。此時如果我們已經(jīng)設(shè)定好了顯著水平 α，即在零假設(shè)正確的前提下拒絕零假設(shè)的概率，并且發(fā)現(xiàn) p-value 小于這個顯著水平，那么我們可以更加確信的拒絕 H0。

回到這個具體的例子，假設(shè)我們得到的 x? = 2.92，則其 z = (2.92 - 3) / 0.03 = -2.67，對應(yīng)標準正態(tài)分布中取得這個 z 值或比其更小的 z 值的概率為 0.0038，這意味這我們從一個均值為 3，均方誤差為 0.03 的正態(tài)分布中取得 x? = 2.92 或更小值的概率為 P(x ≤ 2.92) = 0.0038。

前面由于已經(jīng)知道管理者愿意承擔的第一類錯誤的風險值為 α = 0.01，此時由于 p-value = 0.0038 遠小于這個值，據(jù)此可以更加確定地拒絕零假設(shè)。

更一般地，在左尾檢驗中，如果在假設(shè)檢驗中得到的 p-value 小于等于顯著水平 α，我們就可以拒絕零假設(shè)。由于 p-value 來自于對總體的一個觀測，對于任意小于等于 α 的 p-value，我們都會拒絕零假設(shè)，因此 p-value 也被稱為觀測到得顯著水平。

臨界值法：

臨界值法要求我們?yōu)闄z驗統(tǒng)計量設(shè)定一個臨界值，對于左尾檢驗來說，如果檢驗統(tǒng)計量小于臨界值，那么就可以拒絕零假設(shè)。如果理解了顯著水平這個定義，由于其就是對應(yīng)標準正態(tài)分布中 z 取得某個值左側(cè)部分的概率值，這個值也就是這里的臨界值，也即 α = P(z ≤ 臨界值) 。

在臨界值法進行左尾檢驗中，如果事先已經(jīng)設(shè)定了顯著水平，則可以根據(jù)標準正態(tài)分布表查取取得這個臨界值及其左側(cè)部分的概率為 α 時對應(yīng)的 zα值，然后用這個值和檢驗統(tǒng)計得到的 zx?進行對比，如果 zx?≤ zα那么則可以拒絕零假設(shè)。

從上述計算過程可知，p-value 法和臨界值法是基于同一個原理，也即在抽樣中，符合一定條件的抽樣分布服從正態(tài)分布，在此基礎(chǔ)上 α 就是樣本統(tǒng)計值取在某個臨界點及其左側(cè)區(qū)域內(nèi)的概率值，此時：

$\bullet$ 從樣本統(tǒng)計得到的 zx?值可以通過計算概率來和 α 做對比

$\bullet$ 通過顯著水平 α 計算臨界值 zα來和 zx?做對比

上面的討論是針對左尾檢驗來說的，根據(jù) p-value 的定義，在實際應(yīng)用中有：

$\bullet$ 左尾檢驗：考察的是總體的均值是否大于等于某個假設(shè)，p-value 的值等于取得某個 zx?值為界限的正態(tài)分布曲線左側(cè)部分的面積或者說概率，也即 p-value = P(z ≤ $z_{\bar{x} }$ )，相應(yīng)的拒絕零假設(shè)的條件是 p-value ≤ α 或 $z_{\bar{x} }$ ≤? $z_{\alpha }$

$\bullet$ 右尾檢驗：考察的是總體的均值是否小于等于某個假設(shè)，p-value 的值等于取得某個 zx?值為界限的正態(tài)分布曲線右側(cè)部分的面積或者說概率，也即 p-value = 1 - P(z ≤ $z_{\bar{x} }$ )，相應(yīng)的拒絕零假設(shè)的條件是 p-value ≤ α 或 $z_{\bar{x} }$ ≥ $z_{\alpha }$

雙尾檢驗

多時候我們需要被研究對象的某個特征固定在某個假設(shè)的取值附近，既不能太大，也不能太小。此時如果采用抽樣的形式對于總體的特征參數(shù)進行研究時，有的樣本的均值的取值會大于這個假設(shè)的取值，有的樣本的均值的取值會小于這個假設(shè)的取值，也即抽樣得到的均值的取值圍繞設(shè)定值左右波動，那么如何有依據(jù)的評價這個波動的大小進而拒絕這個假設(shè)還是不拒絕這個假設(shè)就需要采用雙尾檢驗。其零假設(shè)和備選假設(shè)的一般形式為：

$H_{0}$ : μ = $\mu _{0}$ ， $H_{\alpha }$ : μ ≠ $\mu _{0}$

再一次地，這個評價的依據(jù)就是選擇好的顯著性水平 α，只不過與單尾檢驗最重要的區(qū)別在于，α 對應(yīng)的概率值被平均分配為正態(tài)分布的左右兩側(cè) $z_{\alpha /2}$ 面積下的概率，其目的是考察抽樣統(tǒng)計值圍繞事先設(shè)定的假設(shè)值的左右偏離程度。相應(yīng)的 p-value 也是取得檢驗統(tǒng)計值及其相反數(shù)的正態(tài)分布兩側(cè)的概率，并且當 P(z ≥ $z_{\bar{x} }$ ) + P(z ≤ - $z_{\bar{x} }$ ) ≤ α 時拒絕零假設(shè)，或者當采用臨界值法時樣本統(tǒng)計值 z ≥ $z_{\alpha /2}$ 或 z ≤ - $z_{\alpha /2}$ 可以認為在服從前述假設(shè)分布的情況下取得這個 z 值是小概率事件，也可以拒絕零假設(shè)。

至此，對于總體均方差已知的情況下對于總體均值的假設(shè)檢驗的討論就結(jié)束了，總結(jié)前面的內(nèi)容如下：

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

商務(wù)與經(jīng)濟統(tǒng)計第9章

商務(wù)與經(jīng)濟統(tǒng)計第9章

1、原假設(shè)和備選假設(shè)的建立

2、第一類錯誤與第二類錯誤

3、總體標準差 σ 已知的總體均值的假設(shè)檢驗

檢驗統(tǒng)計量 Test statistic 及其選擇

雙尾檢驗

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

商務(wù)與經(jīng)濟統(tǒng)計第9章

1、原假設(shè)和備選假設(shè)的建立

2、第一類錯誤與第二類錯誤

3、總體標準差 σ 已知的總體均值的假設(shè)檢驗

檢驗統(tǒng)計量 Test statistic 及其選擇

雙尾檢驗

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

2、第一類錯誤與第二類錯誤

3、總體標準差 σ 已知的總體均值的假設(shè)檢驗