本期解答人:中關(guān)村大街
異質(zhì)性和異方差都帶一個(gè)“異”字,英文前綴也相同——異質(zhì)性是Heterogeneity,異方差是 Heteroskedasticity,但其含義有很大不同。一些朋友易將兩者混淆,筆者嘗試用比較直觀(因此可能不夠嚴(yán)謹(jǐn))的方法進(jìn)行區(qū)分。
一個(gè)變量X對(duì)另一個(gè)變量Y的影響可能因人而異。例如,多上一年學(xué)讓張三的收入增加了1000元,讓李四的收入增加了1200元,那么教育年限對(duì)收入的影響就存在異質(zhì)性。與異質(zhì)性相對(duì)的是同質(zhì)性。如果多上一年學(xué)使所有人的收入都增加1000元,那么教育年限對(duì)收入的影響就是同質(zhì)的。
在變量X的不同水平上,變量Y取值的波動(dòng)大小可能不同。例如,在所有小學(xué)畢業(yè)(上過六年學(xué))的人里面,有的做了老板,年入百萬,有的成為工薪階層,年入幾萬——在六年教育水平上,收入取值的波動(dòng)很大。在所有大學(xué)畢業(yè)(上過十六年學(xué))的人里面,大家都能找到不錯(cuò)的工作,收入多的年賺百萬,收入低的也有幾十萬——在十六年的教育水平上,收入取值的波動(dòng)較小。在這個(gè)例子中,收入(Y)的波動(dòng)大小會(huì)隨著教育水平(X)的變化而變化,因此Y相對(duì)于X有異方差。與異方差相對(duì)的是同方差,也即變量Y的取值波動(dòng)不隨自變量X的變化而變化。例如,小學(xué)畢業(yè)的人的收入水平大都比較低,大學(xué)畢業(yè)的人的收入水平大都比較高,但是小學(xué)畢業(yè)的所有人的收入波動(dòng)大小與大學(xué)畢業(yè)的所有人的收入波動(dòng)大小可能差不多。
異(同)質(zhì)性與異(同)方差之間有怎樣的關(guān)系呢?如果Y相對(duì)于X是同方差,那么X對(duì)Y的影響可能是同質(zhì)的,也可能是異質(zhì)的。簡便起見,我們看一個(gè)極端的例子。假如所有上過六年學(xué)的人的年收入都是1萬元,所有上過七年學(xué)的人的年收入都是1.2萬元,所有上過八年學(xué)的人的年收入都是1.4萬元。那么,收入(Y)相對(duì)于教育年限(X)是同方差的——不管教育水平是多少,收入在同一教育水平內(nèi)的波動(dòng)大小都是0。那么教育年限對(duì)收入的影響呢?六年教育水平的人多上一年學(xué),年收入從1萬元變成1.2萬元,漲了兩千元;七年教育水平的人多上一年學(xué),年收入從1.2萬元變成1.4萬元,也漲了兩千元。換句話說,不管是誰,多上一年學(xué)帶來的收入增長都是兩千元——教育年限對(duì)收入水平的影響是同質(zhì)的。但如果稍微改一下例子,令所有上過八年學(xué)的人的年收入都是1.6萬元,那么收入相對(duì)于教育年限仍是同方差的(方差是0),但教育年限對(duì)收入的影響則存在異質(zhì)性了。六年教育水平的人多上一年學(xué),年收入仍然增加兩千元;但七年教育水平的人多上一年學(xué),年收入增加四千元(從1.2萬元到1.6萬元)。換句話說,教育年限對(duì)收入的影響在上過六年學(xué)和上過七年學(xué)的這兩類群體中是不同的,存在異質(zhì)性。
如果Y相對(duì)于X有異方差,那么一般來說,X對(duì)Y的影響是異質(zhì)的。再來看一個(gè)簡化的例子。假如所有上過六年學(xué)的人的年收入都是1萬元;在上過七年學(xué)的人里面,一部分人(比如女性)的收入是1.1萬元,另一部分人(比如男性)的收入是1.2萬元。那么收入相對(duì)于教育年限是異方差的——在六年教育水平上,收入波動(dòng)是0;但在七年教育水平上,收入存在波動(dòng)。如果上過六年學(xué)的人再上一年學(xué),收入可能漲一千元(對(duì)于女性,從1萬元到1.1萬元),也可能漲兩千元(對(duì)于男性,從1萬元到1.2萬元)。因此,教育年限對(duì)收入的影響可能因人而異(在上述例子中是因性別而異),存在異質(zhì)性。