AB測試原理(五)非參數(shù)檢驗(2)

1. Wilcoxon Signed-rank test

前提:若數(shù)量型匹配(成對)樣本觀測值若成對稱分布,可以用Wilcoxon檢測兩個總體中位數(shù)差異

目標(biāo):檢測差值成對稱分布的兩個總體中位數(shù)是否有差異:

(1) 給定N對樣本觀測值,其中一個來自總體1,一個來自總體2

(2) 對兩總體中位數(shù)之差進(jìn)行檢測,

H0: 總體1中位數(shù)-總體2中位數(shù)=0 , H1:總體1中位數(shù)-總體2中位數(shù)≠0

(3) 計算每對差值

(4) 以差值絕對值順序得到秩(rank)

(5) 以差值符號作為秩的符號,得到符號秩

(6) 所有正的符號秩之和為隨機變量T^+, 計算得值為t^+_0,?T^+作為隨機變量服從N(\mu_{T^+}, \sigma_{T^+}),

\mu_{T^+} = \frac{n(n+1)}{4}, \sigma_{T^+} = \sqrt{\frac{n(n+1)(2n+1)}{24}} ,? ?n>= 10

(7)?t^+ 是 t^+_0的連續(xù)矯正后的值, ?

若 t^ >\mu_{T^+}, p-vlaue=2*(1-P(T^+ >= t^+)) = 2*(1-P(z>=\frac{t^+-\mu_{T^+}}{\sigma_{T^+}})),?

若 t^+ <\mu_{T^+}, p-vlaue=2*P(T^+ <= t^+) = 2*P(z<=\frac{t^+-\mu_{T^+}}{\sigma_{T^+}}),? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(8). p-value<α, 拒絕H0(中位數(shù)有差異),否則無法拒絕H0。

2. Mann-Whitney-Wilcoxon test

前提:數(shù)量型、順序型數(shù)據(jù),不需要假定總體服從正態(tài)分布

目標(biāo):檢測量總體是否有差異

(1) 給定來自總體1的n1個樣本,來自總體2的n2個樣本,和兩個總體同一維度的觀測值

(2) H0:兩總體相等, H1:兩總體有差異, 指定顯著性水平α的值

(3) 將全部樣本混合,排序,得到每個樣本的秩,同序采用平均秩值

(4) 分別計算兩個總體的樣本秩和R1、R2, 以總體1樣本集的秩和作為檢驗統(tǒng)計量W

(5) 當(dāng)兩個樣本容量都大于或等于7時,W的抽樣分布可以用正態(tài)分布近似,即W ~N(\mu_w, \sigma_w)\mu_w = n_1(n_1+n_2+1)/2, \sigma_w = \sqrt{n_1n_2(n_1+n_2+1)/12}

(6).?若 W>\mu_w, p-value=2*P(W>=R_1)=2*(1-P(z>=\frac{R_1-\mu_w}{\sigma_w})

若 W <= \mu_w, p-value=2*P(W<=R_1)=2*P(z<=\frac{R_1-\mu_w}{\sigma_w})? ? ? ?

?(7). 若p-value<α,拒絕H0(兩總體有差異), 否則不能拒絕H0

若量總體形態(tài)相同,MWW可用于兩總體中位數(shù)差異的雙側(cè)、單側(cè)檢驗,

?即H0:中位數(shù)1- 中位數(shù)2=0, H1:中位數(shù)1-中位數(shù)2≠0。

3. 克魯斯卡爾--沃利斯檢驗

前提:數(shù)量型、順序型數(shù)據(jù),不需要假定總體服從正態(tài)分布

目標(biāo):對K個總體的K個獨立隨機樣本集的分析

(1) 來自K個總體的K個獨立隨機樣本集的觀測值

(2) H0:所有總體相同;H1:并非所有總體都相同, 指定顯著性水平α

(3) 將所有數(shù)據(jù)混合排序得到所有樣本值的秩,同序采用平均秩值

(4) 分別計算來自K個總體的樣本秩和R1,...., Rk

(5) 計算統(tǒng)計量H=(\frac{12}{n_T(n_T+1)}\sum_{i=1}^k \frac{R_i^2}{n_i})-3(n_T +1) , n_T = \sum_{i=1}^k n_i

(6) ?當(dāng)每個總體容量都>=5, H的抽樣分布近似服從自由度為k-1的\chi^2分布, 利用\chi ^2分布求p-value

(7)??若p-value<α,拒絕H0(k個總體不全相同), 否則不能拒絕H0

若k個總體形態(tài)相同,可用于k個總體中位數(shù)是否相同的檢測。

4. 秩相關(guān) Spearman rank-correlation coefficient (相關(guān)性檢測)

目標(biāo):兩個變量的相關(guān)關(guān)系是否顯著的檢測

(1) 對兩個變量分別排序得到每個樣本每個變量值的秩;

(2) 計算樣本集兩個變量的Spearman 秩相關(guān)系數(shù),?r_s = 1-\frac{6\sum_{i-1}^n d_i^2}{n(n^2+1)}, 推斷總體變量1和變量2的相關(guān)秩為\r_s;

(3) H0:?H0: \r_s = 0, H1:\r_s \neq 0 , 確定顯著性水平α;

(4) 當(dāng)n>=10時,r_s的抽樣分布近似服從N(\mu_{r_s}, \sigma_{r_s}), \mu_{r_s} = 0, \sigma_{r_s} = \sqrt{\frac{1}{n-1}} ;

(5)?若r_s>\mu_s, 2*(1-P(z>= \frac{r_s-\mu_s}{\sigma_s})),?若r_s<=\mu_s, 2*(P(z<= \frac{r_s-\mu_s}{\sigma_s}));

(6)?若p-value<α,拒絕H0(即總體的變量1與2顯著相關(guān)), 否則不能拒絕H0。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容