在進(jìn)行假設(shè)檢驗過程中,包括t檢驗,F(xiàn)檢驗,非參數(shù)檢驗以及卡方檢驗等,最后均是通過P值是否大于0.05或0.01進(jìn)行評價,認(rèn)為兩組或多組的差異是否有統(tǒng)計學(xué)意義。
一般來講,P<0.05或P<0.01,我們認(rèn)為比較的兩組差異有統(tǒng)計學(xué)意義,但是能認(rèn)為P<0.05的兩組差異顯著,而P<0.01兩組差異極其顯著,這里比較P值的大小是沒有意義的。在T檢驗中,P值是通過樣本例數(shù)N,檢驗水平α,以及檢驗統(tǒng)計量t值計算得到的,也就是在α=0.05的情況下,計算得到的檢驗統(tǒng)計量t>tα/2,n , 進(jìn)而推算的P<α=0.05,也就是說P值是與檢驗α水平,N相關(guān)的,而與樣本之間差異的大小無關(guān)。

一個簡單的例子,男性和女性總體身高肯定是存在差異的,假設(shè)我們設(shè)置檢驗水平α=0.05,H0:兩組身高無顯著差異,N=1000。進(jìn)行假設(shè)檢驗,得到檢驗統(tǒng)計量t >t0.05/2,1000=1.96,即P<0.05,那么我們拒絕H0,認(rèn)為兩組在檢驗水平α=0.05的情況下,兩組差異有統(tǒng)計學(xué)意義。
同樣的,假設(shè)我們設(shè)置檢驗水平α=0.01,H0:兩組身高無顯著差異,N=1000。進(jìn)行假設(shè)檢驗發(fā)現(xiàn)檢驗統(tǒng)計量t>t0.01/2,1000=2.58,即P<0.01,那么我們拒絕H0,認(rèn)為兩組在檢驗水平α=0.01的情況下,兩組差異有統(tǒng)計學(xué)意義。也就是兩組數(shù)據(jù)的差異就再那里不增不減,不會因為我們P值大小,差異會發(fā)生變化。因為在假設(shè)檢驗過程中采用了不同的檢驗水平,只能說我們更有把握認(rèn)為男女身高有差異了。
此外,統(tǒng)計學(xué)差異和生物學(xué)意義也要辯證的去看待。
1:無統(tǒng)計學(xué)差異而有生物學(xué)意義
Α,B兩組艾滋病患者采用不同的藥物治療,其中Α組1例患者被完全治愈,在統(tǒng)計分析上是無統(tǒng)計學(xué)意義的,但是卻具有明顯的生物學(xué)意義,你可以對這例患者進(jìn)行深入的研究,或許就可以打開解救艾滋病患者的大門。
2:有統(tǒng)計學(xué)差異而無生物學(xué)意義
檢驗一組高血壓患者采用藥物治療前后血壓變化水平發(fā)現(xiàn),藥物治療后患者血壓評價降低10mmHg,兩組配對t檢驗,差異有統(tǒng)計學(xué)意義,但是臨床上認(rèn)為降血壓藥物要達(dá)到15 mmHg的治療效果才會有意義。這個問題還可以引申為有統(tǒng)計學(xué)意義,但不一定有實際意義。比如分析兩種事件的相關(guān)性,小紅在10歲的時候,門口種下了一顆小樹苗,每年統(tǒng)計小紅的身高和小樹苗的高度變化,10年之后,對小紅的身高和小樹苗的高度進(jìn)行統(tǒng)計發(fā)現(xiàn),兩者呈顯著正相關(guān),有顯著的統(tǒng)計學(xué)意義,但是顯然兩者之間不會有什么實際的生物學(xué)意義。
所以,統(tǒng)計學(xué)差異并不等于生物學(xué)意義,還要結(jié)合具體的臨床或統(tǒng)計標(biāo)準(zhǔn)進(jìn)行分析。在我們還在探討P值的時候,Nature上已有幾百位科學(xué)家聯(lián)名批判P值在科研中的濫用了w(?Д?)w。文章題目:Scientists rise up against statistical significance
轉(zhuǎn)自“醫(yī)學(xué)統(tǒng)計園”微信公眾號,歡迎掃描二維碼關(guān)注
