【r<-基礎(chǔ)|實(shí)戰(zhàn)|統(tǒng)計(jì)|轉(zhuǎn)載】 統(tǒng)計(jì)中的樣本檢驗(yàn)基礎(chǔ)和R實(shí)踐

看到一個(gè)博客上寫的一般檢驗(yàn)的R應(yīng)用總結(jié),挺不錯(cuò)的,分享一下。

本文總結(jié)了R in Action一書中提到的關(guān)于樣本檢驗(yàn)的內(nèi)容,以概要的形式提供給讀者以及自己參考。
注: H0表示空假設(shè),即樣本檢測(cè)的假設(shè)對(duì)象。
獨(dú)立性檢驗(yàn)(列聯(lián)表)
卡方檢驗(yàn):H0:假設(shè)二維表的行和列變量相互獨(dú)立。stats
包的
chisq.test()*

Fisher精確檢驗(yàn): H0:邊界固定的二維列聯(lián)表行和列獨(dú)立。stats
包的
fisher.test()*

Cochran-Mantel-Haenszel檢驗(yàn):*H0:兩個(gè)名義變量在第三個(gè)變量的每一層中都是條件獨(dú)立的。stats
包的.test()

相關(guān)性檢驗(yàn)
常用系數(shù):Pearson, Spearman, Kendall, 偏相關(guān)系數(shù), 多分格polychoric,多系列polyserial

PSK: 相關(guān)系數(shù)cor(), 協(xié)方差cov(),psych
包的corr.test()

偏相關(guān):控制一個(gè)或多個(gè)定量變量,檢驗(yàn)另外兩個(gè)變量之間的相關(guān)性。ggm
包的pcor()

其他類型:polycor
包的hetcor()有多種其他類型的相關(guān)函數(shù)

相關(guān)顯著性檢驗(yàn)
PSK: cor.test(), corr.test().后者可同時(shí)檢測(cè)多種相關(guān)關(guān)系。

其他類型:psych
包的pcor.test() & r.test()

分組檢測(cè)

  1. 參數(shù)檢驗(yàn)
    獨(dú)立樣本t檢驗(yàn):H0:被檢驗(yàn)的兩組樣本獨(dú)立且均值相等,并且從正態(tài)總體中抽的。stats
    包的
    t.test()*

非獨(dú)立樣本t檢驗(yàn):兩組觀測(cè)相關(guān),一般通過非獨(dú)立組設(shè)計(jì)獲得,如pre-post design, repeated measures design。 H0:假定組間差異呈正態(tài)分布,且均值相等。stats
包的
t.test(.。, paired=TRUE)*

多于兩組的非獨(dú)立樣本:如果對(duì)比組大于2且滿足數(shù)據(jù)是從正態(tài)總體中獨(dú)立抽樣獲得的假設(shè),可采用ANOVA方差分析。

  1. 非參數(shù)檢驗(yàn): 通常獨(dú)立樣本也被稱作單樣本(one-sample)檢驗(yàn),非獨(dú)立樣本被稱作雙樣本(two-sample) 檢驗(yàn)。單樣本檢驗(yàn)的自由度是n1+n2-1,雙樣本檢驗(yàn)自由度是n/2-1.
    兩組獨(dú)立樣本:可以使用Wilcoxon秩和檢驗(yàn)(Mann-Whitney U檢驗(yàn)), wilcox.test()

兩組非獨(dú)立樣本:可以使用Wilcoxon符號(hào)秩檢驗(yàn)。它適用于兩組成對(duì)數(shù)據(jù)且無法保證正態(tài)性假設(shè)的情景。stats
包的wilcox.test(.., paired=TRUE)

多于兩組的樣本:如果各組樣本獨(dú)立,則可使用Krushkal-Wallis檢驗(yàn);如果不獨(dú)立,可使用Friedman檢驗(yàn)。H0:各組的平均值相同。stats
包的
kruskal.test() &friedman.test()。npmc
包的
npmc()*函數(shù)可實(shí)現(xiàn)非參數(shù)的多組比較。

樣本檢驗(yàn)的一般步驟
提出研究問題,總結(jié)出需要通過數(shù)據(jù)分析得出的問題。

描述空假設(shè)和被選假設(shè)??占僭O(shè)的提出通常需要能夠通過數(shù)據(jù)分析得出“接受”或“拒絕”的結(jié)論,如均值相等,均值大于X0等。

清楚假設(shè)條件。檢驗(yàn)過程是在一定的假設(shè)條件下進(jìn)行的,比如通常需要考慮,樣本是否獨(dú)立分布,均值和方差的統(tǒng)計(jì)分布等。

根據(jù)樣本數(shù)量和假設(shè)條件,選擇合適的檢驗(yàn)方法,如t檢驗(yàn),以及檢驗(yàn)統(tǒng)計(jì)量T。

在空假設(shè)和觀測(cè)樣本的基礎(chǔ)上,計(jì)算檢驗(yàn)的統(tǒng)計(jì)分布,如學(xué)生分布或正態(tài)分布。

選擇合適的統(tǒng)計(jì)顯著水平p-value,常用的5%和1%。

計(jì)算檢驗(yàn)統(tǒng)計(jì)量T的拒絕區(qū)間(critical region),即在該區(qū)間內(nèi),空假設(shè)即被拒絕為真。

根據(jù)觀測(cè)樣本,計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)直t_obs。

得出結(jié)論:如果t_obs落在拒絕區(qū)間里,則拒絕空假設(shè);否則,無法拒絕空假設(shè)。

相關(guān)鏈接:
Statistical hypothesis testing
Exploratory data analysis
Quick-R: t-test

原地址:http://xiaming.me/posts/2014/05/06/%E7%BB%9F%E8%AE%A1%E4%B8%AD%E7%9A%84%E6%A0%B7%E6%9C%AC%E6%A3%80%E9%AA%8C%E5%9F%BA%E7%A1%80%E5%92%8CR%E5%AE%9E%E8%B7%B5/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容