自舉匯聚法,也稱為bagging方法,是在從原始數(shù)據(jù)集選擇s次后 得到s個(gè)新數(shù)據(jù)集的一種技術(shù)。新數(shù)據(jù)集和原數(shù)據(jù)集的大小相等。每個(gè)數(shù)據(jù)集都是通過在原始 數(shù)據(jù)集中隨機(jī)選擇一個(gè)樣本來進(jìn)行替換而得到的。這里的替換就意味著可以多次地選擇同一 樣本。這一性質(zhì)就允許新數(shù)據(jù)集中可以有重復(fù)的值,而原始數(shù)據(jù)集的某些值在新集合中則不 再出現(xiàn)。
在s個(gè)數(shù)據(jù)集建好之后,將某個(gè)學(xué)習(xí)算法分別作用于每個(gè)數(shù)據(jù)集就得到了s個(gè)分類器。當(dāng)我們 要對(duì)新數(shù)據(jù)進(jìn)行分類時(shí),就可以應(yīng)用這s個(gè)分類器進(jìn)行分類。最終采用投票機(jī)制,得票多的即為樣本所屬分類。
boosting是基于所有分類器的加權(quán)平均求結(jié)果的。而bagging的分類器權(quán)重是相同的,共同投票得出結(jié)果。

image.png
這里引用了網(wǎng)上的一張圖。不再過多贅述。
由于深度學(xué)習(xí)算法的應(yīng)用越來越廣,機(jī)器學(xué)習(xí)的這些算法就不在做過多簡(jiǎn)介了。后續(xù)開始介紹深度學(xué)習(xí)算法。