boosting和bagging

bagging算法思想:

① 對(duì)于一個(gè)給定的含有n個(gè)訓(xùn)練樣本的數(shù)據(jù)集D={x1,x2,.....xn};

② 重復(fù)步驟①進(jìn)行T遍得到T個(gè)訓(xùn)練集Si;

③ 在每個(gè)訓(xùn)練集上采用某種分類算法獨(dú)立地訓(xùn)練出T個(gè)基分類器Ci;

④ 對(duì)于每個(gè)測(cè)試樣本x,采用多輸投票方式得到最終的預(yù)測(cè)結(jié)果c*(x)。

Boosting算法的思想:

先賦予訓(xùn)練集中每個(gè)樣本相同的權(quán)重,然后進(jìn)行T次迭代,每次迭代后,對(duì)分類錯(cuò)誤的樣本加大重采樣權(quán)重,使得在下一次的迭代中更加關(guān)注這些樣本。這樣訓(xùn)練的多個(gè)弱分類器進(jìn)行加權(quán)融合,產(chǎn)生一個(gè)最后的結(jié)果分類器。在這T個(gè)弱小分類器中,每個(gè)分類器的準(zhǔn)確率不一定很高,但他們聯(lián)合后的結(jié)果有很高的準(zhǔn)確率,這樣便提高了該弱分類算法的準(zhǔn)確率。單個(gè)弱分類器訓(xùn)練的時(shí)候,可以用相同的分類算法,也可以用不同的分類算法,這些算法一般是不穩(wěn)定的弱分類算法,如神經(jīng)網(wǎng)絡(luò)(BP) ,決策樹(C4.5)等。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容