辛普森悖論(Simpson Paradox)定義:
辛普森悖論為英國統(tǒng)計(jì)學(xué)家E.H.辛普森(E.H.Simpson)于1951年提出的悖論,即在某個(gè)條件下的兩組數(shù)據(jù),分別討論時(shí)都會(huì)滿足某種性質(zhì),可是一旦合并考慮,卻可能導(dǎo)致相反的結(jié)論。
例子說明
- 比賽100場球賽以總勝率評(píng)價(jià)好壞。取巧的人專找高手挑戰(zhàn)20場而勝1場,另外80場找平手挑戰(zhàn)而勝40場,結(jié)果勝率41%;認(rèn)真的人則專挑高手挑戰(zhàn)80場而勝8場,而剩下20場平手打個(gè)全勝,結(jié)果勝率為28%,比41%小很多。但仔細(xì)觀察挑戰(zhàn)對(duì)象,后者明顯更有實(shí)力
2.詳見 數(shù)據(jù)分析必須警惕的坑:辛普森悖論 中的IOS/Andrioid設(shè)備的轉(zhuǎn)化率
其他
- A/B Test 實(shí)驗(yàn)時(shí)需注意
避免方法
- 樣本選取要隨機(jī)、均衡
- 加權(quán)重參數(shù)計(jì)算各項(xiàng)的總和