以下三項基本假設(shè)闡明了泛化:
- 我們從分布中隨機(jī)抽取獨立同分布 (i.i.d) 的樣本。換言之,樣本之間不會互相影響。(另一種解釋:i.i.d. 是表示變量隨機(jī)性的一種方式)。
- 分布是平穩(wěn)的;即分布在數(shù)據(jù)集內(nèi)不會發(fā)生變化。
- 我們從同一分布的數(shù)據(jù)劃分中抽取樣本。
在實踐中,我們有時會違背這些假設(shè)。例如:
- 想象有一個選擇要展示的廣告的模型。如果該模型在某種程度上根據(jù)用戶以前看過的廣告選擇廣告,則會違背 i.i.d. 假設(shè)。
- 想象有一個包含一年零售信息的數(shù)據(jù)集。用戶的購買行為會出現(xiàn)季節(jié)性變化,這會違反平穩(wěn)性。
如果違背了上述三項基本假設(shè)中的任何一項,那么我們就必須密切注意指標(biāo)。