2.雙因素方差分析
如果要考慮兩個(gè)因素對(duì)指標(biāo)的影響,
各劃分幾個(gè)水平,對(duì)每一個(gè)水平組合作若干次試驗(yàn),對(duì)所得數(shù)據(jù)進(jìn)行方差分析,檢驗(yàn)兩因素是否分別對(duì)指標(biāo)有顯著影響,或者還要進(jìn)一步檢驗(yàn)兩因素是否對(duì)指標(biāo)有顯著的交互影響。
2.1.數(shù)學(xué)模型
設(shè)取
個(gè)水平
,
取
個(gè)水平
,在水平組合
下總體
服從正態(tài)分布
。又設(shè)在水平組合
下作了
個(gè)試驗(yàn),所得結(jié)果記作
服從
,
,
,且相互獨(dú)立。將這些數(shù)據(jù)列成下表的形式。
雙因素試驗(yàn)數(shù)據(jù)表
| ... | ||||
|---|---|---|---|---|
| ... | ||||
| ... | ||||
| ... | ... | ... | ... | ... |
| ... |
將分解為:
其中,且相互獨(dú)立。記
\mu是總均值,是水平
對(duì)指標(biāo)的效應(yīng),
是水平
對(duì)指標(biāo)的效應(yīng),
是水平
與
對(duì)指標(biāo)的交互效應(yīng)。模型表為:
原假設(shè)為:
2.2.無(wú)交互影響的雙因素方差分析
如果根據(jù)經(jīng)驗(yàn)或某種分析能夠事先判定兩因素之間沒有交互影響,每組試驗(yàn)就不必重復(fù),即可令,過(guò)程大為簡(jiǎn)化。
假設(shè),于是:
此時(shí),模型(16)可寫成:
對(duì)這個(gè)模型我們所要檢驗(yàn)的假設(shè)為式(17)和式(18)。下面采用與單因素方差分析模型類似的方法導(dǎo)出檢驗(yàn)統(tǒng)計(jì)量。
記:
其中為全部試驗(yàn)數(shù)據(jù)的總變差,稱為總平方和,對(duì)其進(jìn)行分解:
可以驗(yàn)證,在上述平方和分解中交叉項(xiàng)均為 0。其中:
我們先來(lái)看看的統(tǒng)計(jì)意義。因?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=%5Coverline%7Bx%7D_%7Bi%20%5Cbullet%7D" alt="\overline{x}_{i \bullet}" mathimg="1">是水平
下所有觀測(cè)值的平均,所以
反映了
差異的程度。這種差異是由于因素
的不同水平所引起的,因此
稱為因素
平方和。類似地,
稱為因素
的平方和。至于
的意義不甚明顯,我們可以這樣來(lái)理解:因?yàn)?br>
在我們所考慮的兩因素問(wèn)題中,除了因素和
之外,剩余的再?zèng)]有其它系統(tǒng)性因素的影響,因此從總平方和中減去
和
之后,剩下的數(shù)據(jù)變差只能歸入隨機(jī)誤差,故
反映了試驗(yàn)的隨機(jī)誤差。
有了總平方和的分解式:
以及各個(gè)平方和的統(tǒng)計(jì)意義,我們就可以明白,假設(shè)(17)的檢驗(yàn)統(tǒng)計(jì)量應(yīng)取為與
的比。
和一元方差分析相類似,可以證明,當(dāng)成立時(shí),
當(dāng)成立時(shí):
檢驗(yàn)規(guī)則為:
時(shí)接受
,否則拒絕
;
時(shí)接受
,否則拒絕
;
可以寫出方差分析表:
無(wú)交互效應(yīng)的兩因素方差分析表
| 方差來(lái)源 | 平方和 | 自由度 | 均方 |
|
|---|---|---|---|---|
| 因素 |
||||
| 因素 |
||||
| 誤差 | ||||
| 總和 |
2.3.關(guān)于交互效應(yīng)的雙因素方差分析
與前面方法類似,記:
將全體數(shù)據(jù)對(duì)的偏差平方和:
進(jìn)行分解,可得:
其中:
稱為誤差平方和,
為因素
的平方和(或行間平方和),
為因素
的平方和(或列間平方和),
為交互作用的平方和(或格間平方和)。
可以證明,當(dāng)成立時(shí):
據(jù)此統(tǒng)計(jì)量,可以檢驗(yàn)。
檢驗(yàn)因子和
各個(gè)水平的效應(yīng)是否有差異,與 2.2 中的檢驗(yàn)是一樣的。
雙因素方差分析表
| 方差來(lái)源 | 平方和 | 自由度 | 均方 |
|
|---|---|---|---|---|
| 因素 |
||||
| 因素 |
||||
| 交互效應(yīng) | ||||
| 誤差 | ||||
| 總和 |
2.4.Matlab實(shí)現(xiàn)
統(tǒng)計(jì)工具箱中用 anova2 作雙因素方差分析。命令為
p=anova2(x,reps)
其中 x 不同列的數(shù)據(jù)表示單一因素的變化情況,不同行中的數(shù)據(jù)表示另一因素的變化情況。如果每種行—列對(duì)(“單元”)有不止一個(gè)的觀測(cè)值,則用參數(shù) reps 來(lái)表明每個(gè)“單元”多個(gè)觀測(cè)值的不同標(biāo)號(hào),即 reps 給出重復(fù)試驗(yàn)的次數(shù) t 。下面的矩陣中,列因素有 3 種水平,行因素有兩種水平,但每組水平有兩組樣本,相應(yīng)地用下標(biāo)來(lái)標(biāo)識(shí):
例3 一種火箭使用了四種燃料、三種推進(jìn)器,進(jìn)行射程試驗(yàn),對(duì)于每種燃料與每種推進(jìn)器的組合作一次試驗(yàn),得到試驗(yàn)數(shù)據(jù)如下表。問(wèn)各種燃料之間及各種推進(jìn)器之間有無(wú)顯著差異?
火箭試驗(yàn)數(shù)據(jù)
| 58.2 | 56.2 | 65.3 | |
| 49.1 | 54.1 | 51.6 | |
| 60.1 | 70.9 | 39.2 | |
| 75.8 | 58.2 | 48.7 |
解:記燃料為因素,它有4個(gè)水平,水平效應(yīng)為
,
。推進(jìn)器為因素
,它有 3 個(gè)水平,水平效應(yīng)為
。我們?cè)陲@著性水平
下檢驗(yàn):
編寫如下的Matlab程序:
x=[58.2 56.2 65.3
49.1 54.1 51.6
60.1 70.9 39.2
75.8 58.2 48.7];
[p,t,st]=anova2(x)
求得p=0.4491 0.7387,表明各種燃料和各種推進(jìn)器之間的差異對(duì)于火箭射程無(wú)顯著影響。
例4 一火箭使用了 4 種燃料,3 種推進(jìn)器作射程試驗(yàn),每種燃料與每種推進(jìn)器的組合各發(fā)射火箭 2 次,得到如下表結(jié)果。
| 58.2,52.6 | 56.2,41.2 | 65.3,60.8 | |
| 49.1,42.8 | 54.1,50.5 | 51.6,48.4 | |
| 60.1,58.3 | 70.9,73.2 | 39.2,40.7 | |
| 75.8,71.5 | 58.2,51.0 | 48.7,41.4 |
試在水平 0.05 下,檢驗(yàn)不同燃料(因素 )、不同推進(jìn)器(因素
)下的射程是否有顯著差異?交互作用是否顯著?
解 編寫程序如下:
clc,clear
x0=[58.2,52.6 56.2,41.2 65.3,60.8
49.1,42.8 54.1,50.5 51.6,48.4
60.1,58.3 70.9,73.2 39.2,40.7
75.8,71.5 58.2,51.0 48.7,41.4];
x1=x0(:,1:2:5);x2=x0(:,2:2:6);
for i=1:4
x(2*i-1,:)=x1(i,:);
x(2*i,:)=x2(i,:);
end
[p,t,st]=anova2(x,2)
求得,表明各試驗(yàn)均值相等的概率都為小概率,故可拒絕均值相等假設(shè)。即認(rèn)為不同燃料(因素
)、不同推進(jìn)器(因素
)下的射程有顯著差異,交互作用也是顯著的。
數(shù)據(jù)非均衡的雙因素方差分析的 Matlab 命令要使用多因素方差分析的命令anovan,具體使用方法參見下面的例 5。
3.正交試驗(yàn)設(shè)計(jì)與方差分析
前面介紹了一個(gè)或兩個(gè)因素的試驗(yàn),由于因素較少,我們可以對(duì)不同因素的所有可能的水平組合做試驗(yàn),這叫做全面試驗(yàn)。當(dāng)因素較多時(shí),雖然理論上仍可采用前面的方法進(jìn)行全面試驗(yàn)后再做相應(yīng)的方差分析,但是在實(shí)際中有時(shí)會(huì)遇到試驗(yàn)次數(shù)太多的問(wèn)題。如三因素四水平的問(wèn)題,所有不同水平的組合有種,在每一種組合下只進(jìn)行一次試驗(yàn),也需做 64 次。如果考慮更多的因素及水平,則全面試驗(yàn)的次數(shù)可能會(huì)大得驚人。因此在實(shí)際應(yīng)用中,對(duì)于多因素做全面試驗(yàn)是不現(xiàn)實(shí)的。于是我們考慮是否可以選擇其中一部分組合進(jìn)行試驗(yàn),這就要用到試驗(yàn)設(shè)計(jì)方法選擇合理的試驗(yàn)方案,使得試驗(yàn)次數(shù)不多,但也能得到比較滿意的結(jié)果。
3.1.用正交表安排試驗(yàn)
正交表是一系列規(guī)格化的表格,每個(gè)表都有一個(gè)記號(hào),如,見下表:
| 1 | 2 | 3 | 4 | |
|---|---|---|---|---|
| 1 | 1 | 1 | 3 | 2 |
| 2 | 2 | 1 | 1 | 1 |
| 3 | 3 | 1 | 2 | 3 |
| 4 | 1 | 2 | 2 | 1 |
| 5 | 2 | 2 | 3 | 3 |
| 6 | 3 | 2 | 1 | 2 |
| 7 | 1 | 3 | 1 | 3 |
| 8 | 2 | 3 | 2 | 2 |
| 9 | 3 | 3 | 3 | 1 |
從上表可見,有9行,4列,表的主體中只有1,2,3三個(gè)數(shù)字組成。
正交表的組成:
(1)每列中數(shù)字出現(xiàn)的次數(shù)相同,如表每列中數(shù)字 1,2,3 均出現(xiàn)三次。
(2)任取兩列數(shù)字的搭配是均衡的,如表里每?jī)闪兄?img class="math-inline" src="https://math.jianshu.com/math?formula=(1%2C1)%2C%20%5Cquad(1%2C2)%2C%20%5Cquad%20%5Ccdots%EF%BC%8C(3%2C3)" alt="(1,1), \quad(1,2), \quad \cdots,(3,3)" mathimg="1">,九種組合各出現(xiàn)一次。
這種均衡性是一般正交表構(gòu)造的特點(diǎn),它使得根據(jù)正交表安排的試驗(yàn),其試驗(yàn)結(jié)果
具有很好的可比性,易于進(jìn)行統(tǒng)計(jì)分析。
用正交表安排試驗(yàn)時(shí),根據(jù)因素和水平個(gè)數(shù)的多少以及試驗(yàn)工作量的大小來(lái)考慮選用哪張正交表,下面舉例說(shuō)明。
例5 為提高某種化學(xué)產(chǎn)品的轉(zhuǎn)化率(%),考慮三個(gè)有關(guān)因素:反應(yīng)溫度
(℃),反應(yīng)時(shí)間
(min)和使用催化劑的含量
(%)。各因素選取三個(gè)水平,如下表所示。
| 溫度 |
時(shí)間 |
催化劑含量 |
|
|---|---|---|---|
| 1 | 80 | 90 | 5 |
| 2 | 85 | 120 | 6 |
| 3 | 90 | 150 | 7 |
如果做全面試驗(yàn),則需次,若用正交表
,僅做 9 次試驗(yàn)。將三個(gè)因素
分別放在
表的任意三列上,如將
分別放在
的第 1,2 列上,
放在
的第 4 列上。將表中
所在的三列上的數(shù)字 1,2,3 分別用相應(yīng)的因素水平去替代,得 9 次試驗(yàn)方案。以上工作稱為表頭設(shè)計(jì)。再將 9 次試驗(yàn)結(jié)果轉(zhuǎn)化率數(shù)據(jù)列于表上(見下表)。
| 反應(yīng)溫度 |
反應(yīng)時(shí)間 |
催化劑含量 |
轉(zhuǎn)化率 | |
|---|---|---|---|---|
| 1 | 80(1) | 90(1) | 6(2) | 31 |
| 2 | 85(2) | 90(1) | 5(1) | 54 |
| 3 | 90(3) | 90(1) | 7(3) | 38 |
| 4 | 80(1) | 120(2) | 5(1) | 53 |
| 5 | 85(2) | 120(2) | 7(3) | 49 |
| 6 | 90(3) | 120(2) | 6(2) | 42 |
| 7 | 80(1) | 150(3) | 7(3) | 57 |
| 8 | 85(2) | 150(3) | 6(2) | 62 |
| 9 | 90(3) | 150(3) | 5(1) | 64 |
這里不做統(tǒng)計(jì)分析,直接利用 Matlab 多因素方差分析的函數(shù) anovan 進(jìn)行求解,程序如下:
y=[31 54 38 53 49 42 57 62 64];
g1=[1 2 3 1 2 3 1 2 3];
g2=[1 1 1 2 2 2 3 3 3];
g3=[2 1 3 1 3 2 3 2 1];
[p,t,st]=anovan(y,{g1,g2,g3})
求得概率,可見因素
的各水平對(duì)指標(biāo)值的影響有顯著差異(顯著性水平取 0.1),而因素
的各水平對(duì)指標(biāo)值的影響無(wú)顯著差異。