1. 關(guān)于P值的理解
P值可以理解為結(jié)論的風(fēng)險(xiǎn)大小,也就是數(shù)據(jù)得出的結(jié)果有多大的錯誤風(fēng)險(xiǎn)。P值越小,結(jié)論錯誤的風(fēng)險(xiǎn)越小,即結(jié)論越可靠;P值越大,錯誤的風(fēng)險(xiǎn)越大,即結(jié)論的可靠性差。P值是對已有結(jié)果的錯誤風(fēng)險(xiǎn)判斷,與結(jié)果大小無關(guān)。目前不少醫(yī)學(xué)雜志上仍然存在著關(guān)于P值的不規(guī)范用語,如P≤0.05認(rèn)為“差異顯著”,P≤0.01認(rèn)為“差異非常顯著”等。不要將P值大小與實(shí)際差異大小聯(lián)系起來。這是一個值得注意的地方。
統(tǒng)計(jì)學(xué)中普遍以0.05作為假設(shè)檢驗(yàn)的檢驗(yàn)水準(zhǔn),這在手工計(jì)算的時代無疑是十分方便的。但到了計(jì)算機(jī)發(fā)達(dá)的今天,我們已經(jīng)可以很輕松地計(jì)算出確切的P值,僅以P≤0.05認(rèn)為有統(tǒng)計(jì)學(xué)意義已經(jīng)不符合潮流了。P值等于0.049和等于0.051有什么差別呢?無非就是0.049比0.051多了0.2%支持結(jié)論的證據(jù),但是少了這0.2%的證據(jù)就沒有意義了嗎?因此,最好給出確切的P值,以便展示更多的信息。
2. 關(guān)于significant的理解
?很多書通常將significant翻譯為“顯著的”,這一詞很容易讓人將其與實(shí)際差別大小聯(lián)系起來。實(shí)際上significant的含義應(yīng)該是“非偶然的”,當(dāng)根據(jù)樣本資料所得結(jié)果是significant,實(shí)際上表明這一結(jié)果“不是偶然”得到的,更可能是真實(shí)存在這樣一種結(jié)果。如顯著性水準(zhǔn)設(shè)為0.05,則P≤0.05表示根據(jù)樣本數(shù)據(jù)計(jì)算的統(tǒng)計(jì)量只有不到5%的可能是偶然(也可以理解為抽樣誤差造成的)造成的,反過來,計(jì)算的統(tǒng)計(jì)量不大可能是偶然造成的,而更有可能是真實(shí)的情況。
3. 統(tǒng)計(jì)學(xué)意義與實(shí)際意義
當(dāng)統(tǒng)計(jì)學(xué)分析結(jié)果顯示P≤0.05時,我們的結(jié)論應(yīng)該寫為“組間差異有統(tǒng)計(jì)學(xué)意義”、“相關(guān)性有統(tǒng)計(jì)學(xué)意“、“影響有統(tǒng)計(jì)學(xué)意義”等,而不應(yīng)該直接寫成“組間有差異”、“變量間有相關(guān)”、“變量有影響”等。統(tǒng)計(jì)學(xué)結(jié)論與實(shí)際結(jié)論不同,它僅反映了從樣本數(shù)據(jù)得到當(dāng)前結(jié)果不是偶然的,但不反映實(shí)際結(jié)果的大小。
?理論上,樣本含量越大,越有可能得到小的P值。即使實(shí)際差別很小,大樣本所得的P值也可能很小,于是問題來了:有的人便認(rèn)為統(tǒng)計(jì)學(xué)是數(shù)字游戲。實(shí)際上并非如此,大樣本P值很小,表明大樣本的結(jié)果更為穩(wěn)定可靠,恰恰反映了統(tǒng)計(jì)學(xué)的嚴(yán)謹(jǐn)性。比如某醫(yī)生治愈1人,他據(jù)此宣稱治愈率為100%,你會相信嗎?但如果他治療10000人仍然全部治愈,那他說治愈率100%,你會不會更相信?關(guān)鍵的問題是,當(dāng)增加樣本的時候,是不是還會保持原來的結(jié)果。治療1人可以治愈,治療第二個人一定會治愈嗎?如果不斷增加樣本,結(jié)果仍然不變,統(tǒng)計(jì)學(xué)就會認(rèn)為這種建立在大樣本基礎(chǔ)上的結(jié)果是可靠的,而不是偶然的,就會給出一個小P值。如果小樣本的結(jié)果發(fā)現(xiàn)有差異,統(tǒng)計(jì)學(xué)會認(rèn)為基于小樣本的差異不一定可靠,因此會給出一個較大的P值,以提醒研究者謹(jǐn)慎下結(jié)論。
4. 單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)
單側(cè)和雙側(cè)檢驗(yàn)多用于組間比較。如果比較A、B兩種藥物的療效,如果預(yù)期B藥不可能不如A藥,則可以采用單側(cè)檢驗(yàn)。這種情形也常用于新藥與安慰劑比較。預(yù)期藥物療效不可能比安慰劑差,則可以用單側(cè)檢驗(yàn)。如果對兩種藥的療效并不確定,B藥可能優(yōu)于A藥,也可能劣與A藥,則多采用雙側(cè)檢驗(yàn)。
一般而言,如果事先對A、B兩組了解不多,沒有足夠的證據(jù)了解A和B誰大誰小,就可選擇雙側(cè)檢驗(yàn),如果事先了解誰大誰小,就可以選擇單側(cè)檢驗(yàn)。值得注意的是:單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)的選擇必須根據(jù)專業(yè)在數(shù)據(jù)分析之前確定。
對于同一資料,單側(cè)檢驗(yàn)比雙側(cè)檢驗(yàn)更容易得到“有統(tǒng)計(jì)學(xué)意義”的結(jié)論,也就是更容易得到陽性結(jié)果。因此,切不可得到P值后再返回來選擇有利的單側(cè)檢驗(yàn)或雙側(cè)檢驗(yàn),否則就真的是在玩統(tǒng)計(jì)學(xué)游戲了。
5. 關(guān)于把握度的理解
把握度又稱檢驗(yàn)效能(power),它表示如果確實(shí)有統(tǒng)計(jì)學(xué)意義的話,按照現(xiàn)有數(shù)據(jù)能夠發(fā)現(xiàn)這種統(tǒng)計(jì)學(xué)意義的概率或把握度有多大。例如:兩組比較中,power為0.8,表示如果兩組確實(shí)有差異的話,那我們在分析中有80%的把握度能夠得到”有統(tǒng)計(jì)學(xué)差異“的結(jié)論。
把握度通常用1-β表示,β即犯第二類錯誤的概率。把握度在平常的統(tǒng)計(jì)分析中一般不大為人所重視,但當(dāng)數(shù)據(jù)出現(xiàn)陰性結(jié)果的時候,你就會發(fā)現(xiàn)它的用處了。你可以用把握度判斷一下陰性結(jié)果是否因?yàn)槔龜?shù)太少,如果是,你可以繼續(xù)增加樣本含量,如果不是,那就只好宣布實(shí)驗(yàn)結(jié)果事與愿違了。