前言
眾所周知,當(dāng)你所自己今年比去年更優(yōu)秀的時(shí)候是不可以隨便吹牛的,請把你在簡書上發(fā)文的頻率以及質(zhì)量擺出來!
面對今年和去年的數(shù)據(jù),或許你需要一個(gè)統(tǒng)計(jì)檢驗(yàn)的方法...
組間差異檢驗(yàn),終于有人講清楚了!

方差齊性?
也就是方差相等,在t檢驗(yàn)和方差分析中,都需要滿足這一前提條件。在兩組和多組比較中,方差齊性的意思很容易理解,無非就是比較各組的方差大小,看看各組的方差是不是差不多大小,如果差別太大,就認(rèn)為是方差不齊,或方差不等。如果差別不大,就認(rèn)為方差齊性或方差相等。當(dāng)然,這種所謂的差別大或小,需要統(tǒng)計(jì)學(xué)的檢驗(yàn),所以就有了方差齊性檢驗(yàn)。
正態(tài)分布檢驗(yàn)
在t檢驗(yàn)和方差分析中,要求樣本是來自正態(tài)分布的樣本。以此為前提才可以對樣本的均值進(jìn)行統(tǒng)計(jì)檢驗(yàn)。檢驗(yàn)的目的是判斷這兩個(gè)樣本是否來自于同一個(gè)總體的隨機(jī)抽樣結(jié)果還是來自完全不同的樣本。另外需要注意的是,如果樣本量大于30,此時(shí)樣本的均值也近似服從正態(tài)分布,這是我們也可以使用t檢驗(yàn)。

參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)
參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)的區(qū)別:
1 參數(shù)檢驗(yàn)是針對參數(shù)做的假設(shè),非參數(shù)檢驗(yàn)是針對總體分布情況做的假設(shè),這個(gè)是區(qū)分參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)的一個(gè)重要特征。例如兩樣本比較的t 檢驗(yàn)是判斷兩樣本分別代表的總體的均值是否具有差異,屬于參數(shù)檢驗(yàn)。而兩樣本比較的秩和檢驗(yàn)(wilcoxcon 檢驗(yàn)及Mann-Whitney 檢驗(yàn))是判斷兩樣本分別代表的總體的位置有無差別(即兩總體的變量值有無傾向性的未知偏離),自然屬于非參數(shù)檢驗(yàn)。
2 二者的根本區(qū)別在于參數(shù)檢驗(yàn)要利用到總體的信息(總體分布、總體的一些參數(shù)特征如方差),以總體分布和樣本信息對總體參數(shù)作出推斷;非參數(shù)檢驗(yàn)不需要利用總體的信息(總體分布、總體的一些參數(shù)特征如方差),以樣本信息對總體分布作出推斷。
3,參數(shù)檢驗(yàn)只能用于等距數(shù)據(jù)和比例數(shù)據(jù),非參數(shù)檢驗(yàn)主要用于記數(shù)數(shù)據(jù)。也可用于等距和比例數(shù)據(jù),但精確性就會(huì)降低。

參數(shù)檢驗(yàn)通常是假設(shè)總體服從正態(tài)分布,樣本統(tǒng)計(jì)量服從T分布的基礎(chǔ)之上,對總體分布中一些未知的參數(shù),例如總體均值、總體方差和總體標(biāo)準(zhǔn)差等進(jìn)行統(tǒng)計(jì)推斷。如果總體的分布情況未知,同時(shí)樣本容量又小,無法運(yùn)用中心極限定理實(shí)施參數(shù)檢驗(yàn),推斷總體的集中趨勢和離散程度的參數(shù)情況。這時(shí),可以用非參數(shù)檢驗(yàn),非參數(shù)檢驗(yàn)對總體分布不做假設(shè),直接從樣本的分析入手推斷總體的分布。
與參數(shù)檢驗(yàn)相比,非參數(shù)檢驗(yàn)適用范圍廣,特別適用于小樣本數(shù)據(jù)、總體分布未知或偏態(tài)、方差不齊及混合樣本等各類型數(shù)據(jù)。

非參數(shù)檢驗(yàn)應(yīng)用廣,但參數(shù)檢驗(yàn)精確度更高。
SPSS賽高

方差和T檢驗(yàn)的區(qū)別在于,對于T檢驗(yàn)的X來講,其只能為2個(gè)類別比如男和女。如果X為3個(gè)類別比如本科以下,本科,本科以上;此時(shí)只能使用方差分析。
方差分析(Analysis of Variance,簡稱ANOVA),又稱“變異數(shù)分析”,是R.A.Fisher發(fā)明的,用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。
卡方檢驗(yàn)與Fisher精確檢驗(yàn)區(qū)別
均為無序分類變量
① 卡方檢驗(yàn)
卡方檢驗(yàn)常用于分析無序分類變量之間的相關(guān)性,也可以用于分析二分類變量之間的關(guān)系。但是該檢驗(yàn)只能分析相關(guān)的統(tǒng)計(jì)學(xué)意義,不能反映關(guān)聯(lián)強(qiáng)度。因此,我們常聯(lián)合Cramer's V檢驗(yàn)提示關(guān)聯(lián)強(qiáng)度。
② Fisher精確檢驗(yàn)
Fisher精確檢驗(yàn)可以用于檢驗(yàn)任何R*C數(shù)據(jù)之間的相關(guān)關(guān)系,但最常用于分析2*2數(shù)據(jù),即兩個(gè)二分類變量之間的相關(guān)性。與卡方檢驗(yàn)只能擬合近似分布不同的是,F(xiàn)isher精確檢驗(yàn)可以分析精確分布,更適合分析小樣本數(shù)據(jù)。但是該檢驗(yàn)與卡方檢驗(yàn)一樣,只能分析相關(guān)的統(tǒng)計(jì)學(xué)意義,不能反映關(guān)聯(lián)強(qiáng)度。
正態(tài)分布的一些定理
(1)從總體中隨機(jī)抽取容量為n的一切可能個(gè)樣本的平均數(shù)之平均數(shù),等于總體的平均數(shù)。
(2)從正態(tài)總體中,隨機(jī)抽取的容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。
(3)雖然總體不是正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。
原始數(shù)據(jù)比較符合正態(tài)分布,那么推薦使用T檢驗(yàn),如果偏離較大,那么推薦使用非參數(shù)檢驗(yàn),如果樣本量較大,那么兩種檢驗(yàn)方法都是可以的。
