標(biāo)準(zhǔn)化歸一化的目的:讓各個(gè)特征的重要性一致,減少各個(gè)特征取值范圍不同造成的影響。
集成學(xué)習(xí):
* Bagging:將訓(xùn)練集隨機(jī)采樣成若干子訓(xùn)練集,產(chǎn)生若干基模型
>基模型:強(qiáng)模型(低偏差高方差)、訓(xùn)練目標(biāo):關(guān)注方差,專注于增強(qiáng)模型的泛化能力。
* Boosting:不斷改變樣本權(quán)重構(gòu)建若干訓(xùn)練集,產(chǎn)生若干基模型
>基模型:弱模型(高偏差低方差)、訓(xùn)練目標(biāo):關(guān)注偏差
* Stacking:第一層(將訓(xùn)練好的基模型對訓(xùn)練集和測試集進(jìn)行預(yù)測,產(chǎn)生新的數(shù)據(jù)集)
? ? ? ? ? ? ? ? ? ? 第二層(基于新的數(shù)據(jù)集,再次訓(xùn)練模型產(chǎn)生最終的預(yù)測結(jié)果)
>基模型:強(qiáng)模型(低偏差高方差)
模型的偏差:訓(xùn)練出來的模型在訓(xùn)練集上的準(zhǔn)確度。
模型的方差:模型泛化能力的大?。ㄔ搭^:數(shù)據(jù)抽樣的隨機(jī)性帶來了模型的隨機(jī)性)