20.10.11. 醫(yī)學(xué)中的統(tǒng)計(jì)學(xué)方法【引】

杜院士是博士畢業(yè)馬上要上院士在學(xué)校當(dāng)老師的醫(yī)生。

最近他老人家給我種草了統(tǒng)計(jì)學(xué),三言?xún)烧Z(yǔ)我被問(wèn)的一愣一愣的,感覺(jué)自己以前學(xué)的統(tǒng)計(jì)學(xué)都被狗吃了。

我決定要弱弱地回?fù)粢幌?。嗯,先扳回三十城吧?/p>

好,開(kāi)始。

導(dǎo)語(yǔ):醫(yī)學(xué)科技論文,特別是高質(zhì)量的原始論著及根據(jù)高質(zhì)量原始論著產(chǎn)生的系統(tǒng)評(píng)價(jià)已不斷地改進(jìn)和規(guī)范著臨床醫(yī)療實(shí)踐活動(dòng)。因此,醫(yī)學(xué)文獻(xiàn)的質(zhì)量高低與我們的臨床醫(yī)療實(shí)踐活動(dòng)密切相關(guān)。然而,如果統(tǒng)計(jì)學(xué)方法應(yīng)用不當(dāng),不僅不能準(zhǔn)確地反映科研結(jié)果,而且還可能帶來(lái)錯(cuò)誤的結(jié)論。

1. 統(tǒng)計(jì)學(xué)方法的內(nèi)容

\bf\color{#c41}{統(tǒng)計(jì)軟件包、檢驗(yàn)水準(zhǔn)、統(tǒng)計(jì)分析方法}是統(tǒng)計(jì)學(xué)方法必須描述的3方面內(nèi)容。

2. 統(tǒng)計(jì)軟件包

SPSS (statistics package for social science) 和SAS(statistical analysis system ) 是全世界學(xué)術(shù)界公認(rèn)且最常用的兩大統(tǒng)計(jì)軟件包。

3. 檢驗(yàn)水準(zhǔn)

檢驗(yàn)水準(zhǔn)即——\mathbf A表示組間實(shí)際無(wú)差別而統(tǒng)計(jì)結(jié)果判斷為有差別,犯這類(lèi)錯(cuò)誤的概率。實(shí)際工作中常取 \mathbf {A=0.05},表示本次研究計(jì)算所得P 值必須小于0.05,才能認(rèn)為組間差異有統(tǒng)計(jì)學(xué)意義。
因而對(duì)于檢驗(yàn)水準(zhǔn)的描述多簡(jiǎn)化為 "\mathbf {P值< 0. 05 為有統(tǒng)計(jì)學(xué)意義}" 。

4. 統(tǒng)計(jì)分析方法

統(tǒng)計(jì)分析方法的準(zhǔn)確描述是科技論文科學(xué)性的關(guān)鍵所在。統(tǒng)計(jì)學(xué)方法一般包括\bf\color{#c41}{統(tǒng)計(jì)描述}\bf\color{#c41} {組間差異性檢驗(yàn)}(即:假設(shè)檢驗(yàn)) 兩部分內(nèi)容。

4.1 統(tǒng)計(jì)描述

統(tǒng)計(jì)描述主要是根據(jù)資料類(lèi)型及原始數(shù)據(jù)分布類(lèi)型,選擇正確的指標(biāo)描述資料特征。

4.1.1 資料類(lèi)型

資料類(lèi)型分為定量資料定性資料

定量資料是指對(duì)每個(gè)觀察對(duì)象測(cè)得的某個(gè)指標(biāo)能夠用具體數(shù)值表示,如:年齡、身高、每張切片的陽(yáng)性細(xì)胞百分率等;

定性資料指對(duì)每個(gè)觀察對(duì)象測(cè)得的某個(gè)指標(biāo)不能用具體數(shù)值表示,僅反映觀察對(duì)象的某一特征,如: 陽(yáng)性、陰性,ABO 血型,治愈、顯效、好轉(zhuǎn)、無(wú)效等。

4.1.2 資料的統(tǒng)計(jì)描述

(1)正態(tài)分布-定量資料-的統(tǒng)計(jì)描述

定量資料如果符合正態(tài)分布,統(tǒng)計(jì)描述指標(biāo)可用均數(shù)及標(biāo)準(zhǔn)差,一般描述為“數(shù)據(jù)以均數(shù)±標(biāo)準(zhǔn)差表示”;

(2)非正態(tài)分布-定量資料-的統(tǒng)計(jì)描述

定量資料如果不符合正態(tài)分布,則統(tǒng)計(jì)描述指標(biāo)選用中位數(shù)和級(jí)差(即: 最大值和最小值之差)。

區(qū)分資料是正態(tài)或偏態(tài)分布,可以通過(guò)SPSS、SAS 統(tǒng)計(jì)軟件程序判斷,也可以通過(guò)目測(cè)數(shù)據(jù)是否有"極端值",即特別大或特別小的數(shù)據(jù),進(jìn)行判斷。

(3)定性資料-的統(tǒng)計(jì)描述

定性資料的統(tǒng)計(jì)描述包括率、構(gòu)成比及相對(duì)比

表示單位時(shí)間內(nèi)某現(xiàn)象或事物發(fā)生的概率,如發(fā)病率、死亡率等;
構(gòu)成比指事物內(nèi)部某一部分的個(gè)體數(shù)與該事物各部分個(gè)體數(shù)的總和之比,表示各構(gòu)成部分在全體中所占的比重或分布,不能說(shuō)明某現(xiàn)象發(fā)生的頻率或強(qiáng)度,如性別構(gòu)成、疾病構(gòu)成、死亡構(gòu)成等。然而,在實(shí)際應(yīng)用中以構(gòu)成比代替率很常見(jiàn)

例如,某文分析240 例耳鼻咽喉科住院患者,鼻竇炎41 例,稱(chēng)發(fā)病率17. 08% ,文中“發(fā)病率”實(shí)際為鼻竇炎患者在該科所有患者中的構(gòu)成比。此外,還有將病死率誤用為死亡率、患病率誤用為發(fā)病率等,這些都需引起作者的注意。某種疾病發(fā)病率= 某段時(shí)間內(nèi)發(fā)生該疾病的人數(shù)/某段時(shí)間內(nèi)可能發(fā)生該種疾病的總?cè)藬?shù)某種疾病構(gòu)成比= 某段時(shí)間內(nèi)發(fā)生該疾病的人數(shù)/某段時(shí)間內(nèi)發(fā)生各種疾病的總?cè)藬?shù)。

4.2 假設(shè)檢驗(yàn)

科技論文中最常用的是組間差異性檢驗(yàn)。假設(shè)檢驗(yàn)方法很多,不同的科研設(shè)計(jì)類(lèi)型及資料類(lèi)型適用的檢驗(yàn)方法有所不同。定量資料與定性資料常用的統(tǒng)計(jì)分析方法介紹如下。

4.2.1 定量資料

定量資料的統(tǒng)計(jì)分析方法包括參數(shù)法非參數(shù)法.
參數(shù)法——t檢驗(yàn)、方差分析;非參數(shù)法——秩和檢驗(yàn)。
選擇的關(guān)鍵在于資料分布類(lèi)型,如果資料符合正態(tài)分布且組間方差齊(即各組標(biāo)準(zhǔn)差彼此接近) 則選用參數(shù)法,不符合則選用非參數(shù)法。
但在許多醫(yī)學(xué)論文中經(jīng)常忽略這兩個(gè)條件,不考慮資料的分布直接采用t 檢驗(yàn)或方差分析,由此得出的分析結(jié)果是不可信的,見(jiàn)例1。

例1:
為研究\bf {TGF-\beta}、\bf CEA 腫瘤標(biāo)志在喉癌患者手術(shù)前、后有無(wú)差異,分別檢測(cè)了58 名患者前及術(shù)后\bf {TGF-\beta}\bf CEA ,經(jīng)配對(duì)\mathbf t檢驗(yàn),\bf {TGF-\beta}術(shù)前、后差異有統(tǒng)計(jì)學(xué)意義,結(jié)果見(jiàn)表1。

表1. 腫瘤標(biāo)記物術(shù)前術(shù)后的檢測(cè)*

組別 TGF- β(μg/l) CEA(μg/l)
術(shù)前 19.0±26.3 34.0±79.0
術(shù)后 4.8±7.5* 20.6±11.2

與術(shù)前比較p值﹤0.05

表中兩指標(biāo)標(biāo)準(zhǔn)差均相差達(dá)2 倍以上,提示方差不齊,故不宜采用t 檢驗(yàn),而適合采用秩和檢驗(yàn)。
\bf\color{#f00}{t檢驗(yàn)}用于兩組均數(shù)間的比較,包括兩獨(dú)立樣本\mathbf t 檢驗(yàn)、配對(duì)\mathbf t檢驗(yàn)和樣本均數(shù)與總體均數(shù)比較的\mathbf t檢驗(yàn);
\bf\color{#f00}{方差分析}用于兩組或兩組以上均數(shù)的比較。然而,在許多醫(yī)學(xué)論文中,對(duì)于3 組或3 組以上均數(shù)的兩兩比較,常重復(fù)使用獨(dú)立樣本t 檢驗(yàn)作比較,如例2。這樣會(huì)加大犯陽(yáng)性錯(cuò)誤的概率,即可能將無(wú)差別的兩個(gè)總體均數(shù)判斷為有差別。這點(diǎn)尤其需引起作者的注意,這也是醫(yī)學(xué)科技論文中\mathbf {t檢驗(yàn)}濫用的重要表現(xiàn)之一。

此類(lèi)資料正確的分析方法應(yīng)是先進(jìn)行方差分析,以確定這幾組均數(shù)總體差異有無(wú)統(tǒng)計(jì)學(xué)意義;如果有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步采用\bf\color{#00f}{q檢驗(yàn)}(任意組間兩兩比較) 或\bf\color{#00f} {Dunnett\ t 檢驗(yàn)}(每個(gè)實(shí)驗(yàn)組與對(duì)照組比較) 以確定哪些組間差異有統(tǒng)計(jì)學(xué)意義。

例2:
為了解不同分化程度的下咽癌患者\mathbf {VEGFR-3} 表達(dá)陽(yáng)性脈管的數(shù)目\mathbf {VEGFR-3}表達(dá)陽(yáng)性脈管差異,分別檢測(cè)16 例高分化患者,15 例中分化者及13 例低分化者,作者采用獨(dú)立樣本\bf {t檢驗(yàn)},結(jié)果見(jiàn)表2。

表2 下咽癌組織中VEGFR- 3 表達(dá)陽(yáng)性脈管與病理分級(jí)的關(guān)系

組別 例數(shù) VEGFR- 3 表達(dá)陽(yáng)性脈管
高分化組 16 14.29±6.50
中分化組 15 15.65±5.84
低分化組 13 16.16±4.75

各組之間p 值﹥0.05

4.2.2 定性資料

定性資料整理與歸納后,主要分為3種類(lèi)型,即四格表資料(只有2組,且結(jié)果變量為2分類(lèi)變量,總絡(luò)子數(shù)為4見(jiàn)表3)、行×列表資料(總格子數(shù)>4,見(jiàn)表4) 和列聯(lián)表資料(又稱(chēng)雙向有序資料,見(jiàn)表5)。
行×列表資料又包括單向有序資料(即等級(jí)資料,2組或2組以上,結(jié)果變量為有序多分類(lèi)變量,見(jiàn)表6)。不同資料類(lèi)型采用的統(tǒng)計(jì)分析方法有所不同。

表3 四格表資料格式

組別 陰性 陽(yáng)性 合計(jì)
實(shí)驗(yàn)組 10 29 39
對(duì)照組 24 11 35
合計(jì) 34 40 74

表4 行×列表資料格式

組別 陰性 陽(yáng)性 合計(jì)
實(shí)驗(yàn)1組 10 29 39
實(shí)驗(yàn)2組 15 19 34
對(duì)照組 24 11 35
合計(jì) 49 59 108

表5 列聯(lián)表資料格式

N 分期
T 分期 N0 N1 N2 N3 合計(jì)
:-: :-: :-: :-: :-: :-:
T1 15 9 4 3 31
T2 13 14 9 4 40
T3 9 14 6 5 34
T4 8 7 7 4 26
合計(jì) 45 44 26 16 131

表6 單向有序資料格式

組別 無(wú)效 好轉(zhuǎn) 顯效 治愈 合計(jì)
實(shí)驗(yàn)組 3 9 11 19 42
對(duì)照組 9 5 7 9 30
合計(jì) 12 14 18 28 72

四格表資料χ2 檢驗(yàn)醫(yī)學(xué)論文中,四格表資料χ2 檢驗(yàn)的應(yīng)用很常見(jiàn),但使用時(shí)應(yīng)注意具體的應(yīng)用條件。當(dāng)總例數(shù)大于40,且每個(gè)格子的理論頻數(shù)均不小于5 時(shí),應(yīng)用未校正的χ2 檢驗(yàn);如果總例數(shù)大于40,有一個(gè)格子的理論頻數(shù)小于5 但大于1,采用校正的χ2 檢驗(yàn); 如果總例數(shù)小于40,或有一個(gè)格子的理論頻數(shù)小于1,則采用Fisher 確切概率法。實(shí)際應(yīng)用中,許多作者不考慮應(yīng)用的前題條件,均使用未校正的χ2 檢驗(yàn),從而導(dǎo)致結(jié)果不可靠。行×列表資料χ2 檢驗(yàn)行×列表資料χ2 檢驗(yàn)主要用于多個(gè)率或構(gòu)成比的比較。但此時(shí)要求所有格子中理論頻數(shù)小于5 的格子數(shù)少于總格子數(shù)的1/5。如果大于1/5 ,則相鄰格子應(yīng)刪除或合并后再計(jì)算。此時(shí)若需了解具體那些率之間差異有統(tǒng)計(jì)學(xué)意義,就需進(jìn)行χ2 分割來(lái)確定。

單向有序資料此類(lèi)資料如果是比較組間治療效果差異有無(wú)統(tǒng)計(jì)學(xué)意義,則應(yīng)采用秩和檢驗(yàn)。如果采用χ2 檢驗(yàn),僅表明各組的療效構(gòu)成差異有無(wú)統(tǒng)計(jì)學(xué)意義,因?yàn)榇藭r(shí)只利用了每組構(gòu)成比提供的信息,損失了有序指標(biāo)提供的“等級(jí)”信息。這也是許多作者誤用統(tǒng)計(jì)學(xué)方法的資料類(lèi)型之一,需尤其注意。列聯(lián)表資料χ2 檢驗(yàn)此類(lèi)資料特征為對(duì)同一組觀察對(duì)象,分別觀察其兩種有序分類(lèi)變量的表現(xiàn),歸納成雙向交叉排列的統(tǒng)計(jì)表,分析兩個(gè)分類(lèi)變量是否有相關(guān)聯(lián)系的假設(shè)檢驗(yàn),采用行×列表χ2 檢驗(yàn)。

4.2.3 相關(guān)性分析

如果需了解兩變量有無(wú)相關(guān)性,或相關(guān)程度有多大,此時(shí)需作相關(guān)分析。相關(guān)分析應(yīng)報(bào)告相關(guān)系數(shù)及對(duì)該相關(guān)系數(shù)所作的假設(shè)檢驗(yàn)P 值。相關(guān)系數(shù)種類(lèi)很多,選擇時(shí)應(yīng)根據(jù)指標(biāo)類(lèi)型來(lái)確定。如果是計(jì)量指標(biāo),則應(yīng)選擇Pearson 相關(guān)系數(shù); 如果是等級(jí)指標(biāo),則應(yīng)選擇Spearman 相關(guān)系數(shù)。

4.2.4 結(jié)論的表述

首先要明確“P 值< 0.05”,習(xí)慣上稱(chēng)“顯著”(significant) ,僅說(shuō)明兩組差異有統(tǒng)計(jì)學(xué)意義,并不能說(shuō)明兩組該指標(biāo)相差很大,或在專(zhuān)業(yè)上有顯著的(重要的)價(jià)值; 反之,P 值>0.05,習(xí)慣上稱(chēng)“不顯著”(non significant) ,不應(yīng)誤解為相差不大,或一定相等,僅說(shuō)明從統(tǒng)計(jì)角度考慮這兩組差異無(wú)統(tǒng)計(jì)學(xué)意義。為了不與一般意義上的“顯著”、“不顯著”相混淆,許多統(tǒng)計(jì)學(xué)家主張作結(jié)論時(shí)不用“是否顯著”一詞,而用“差異有無(wú)統(tǒng)計(jì)學(xué)意義”。

此外,根據(jù)統(tǒng)計(jì)結(jié)果得出專(zhuān)業(yè)結(jié)論不能太絕對(duì)化,因?yàn)榻y(tǒng)計(jì)結(jié)論均是概率性的,不是絕對(duì)的肯定或否定,本次研究統(tǒng)計(jì)結(jié)果是陰性,如果增加樣本含量,組間差異可能就有統(tǒng)計(jì)學(xué)意義了。

綜上所述,不同的統(tǒng)計(jì)分析方法均有其應(yīng)用條件和適用范圍,實(shí)際應(yīng)用時(shí),必須根據(jù)科研設(shè)計(jì)類(lèi)型及變量類(lèi)型選擇恰當(dāng)?shù)慕y(tǒng)計(jì)分析方法,同時(shí)注意檢查結(jié)果解釋和專(zhuān)業(yè)結(jié)論是否同時(shí)滿(mǎn)足專(zhuān)業(yè)和統(tǒng)計(jì)學(xué)要求。切忌將t 檢驗(yàn)、χ2 檢驗(yàn)視為分析資料的“萬(wàn)能工具”,盲目套用,導(dǎo)致文章的科學(xué)性降低。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容