1、Adaboost作為一種集成學習方法,核心思想是經(jīng)過多輪迭代,對分類器的權(quán)重參數(shù)每次迭代進行修正,然后集成得到最優(yōu)解;
2、修正的參數(shù)有兩個:迭代器的權(quán)重、樣本自身的權(quán)重,權(quán)重的大小根據(jù)每輪迭代中的誤分率自我調(diào)節(jié)
3、弱分類器的權(quán)重:
? ? ?假設(shè)我們的訓練集樣本是:T={(,
),(
,
),...(
,
)}
? ? ? 訓練集的在第k個弱學習器的輸出權(quán)重為: D(k)=(,
,...
);
=
;i=1,2...m
? ? ? 這里假設(shè)我們是二元分類問題,輸出為{-1,1},則第k個弱分類器在訓練集上的加權(quán)誤差率為:
? ? ???=?
? ? 接著我們看弱學習器權(quán)重系數(shù),對于二元分類問題,第k個弱分類器的權(quán)重系數(shù)為:
????????從上述式子可以看到弱分類器的誤差率越大,它的權(quán)重系數(shù)越小;
4、樣本的權(quán)重:
? ? ? ? 如何更新樣本權(quán)重:假設(shè)第k個弱分類器的樣本權(quán)重系數(shù)為:,則對應第k+1個弱分類器的樣本集權(quán)重系數(shù)? ? ? ? ? 為:
?=?
exp(
),這里
是歸一化因子。
? ? ? ? 從上述式子可以看到?的值越相近,它們的乘積越大,
的權(quán)重系數(shù)
越小。換句話說,對于分對的樣本,給與的
? ? ? ? 權(quán)重越小,對于分錯的樣本,給與的權(quán)重越大;
5、錯誤率和弱分類器的權(quán)重、樣本的權(quán)重之間的關(guān)系
? ? ? 本次迭代的分類錯誤率越大,整個弱分類器的權(quán)重將會越小,下次迭代的弱分類器所使用的分類錯誤的樣本的權(quán)重越大;