ML 監(jiān)督學(xué)習(xí) 集成學(xué)習(xí) Bagging

Bagging---Bootstrap aggregating

是并行式集成學(xué)習(xí)方法最著名的代表,基于自助采樣法允許在同一種分類器上?對(duì)訓(xùn)練集進(jìn)行多次采樣

自助采樣法(bootstrap sampling)

給定包含m個(gè)樣本的數(shù)據(jù)集,我們先隨機(jī)取出一個(gè)樣本放入采樣集中,再把該樣本放回初始數(shù)據(jù)集,使得下次采樣時(shí)該樣本仍有可能被選中,經(jīng)過m次隨機(jī)采樣操作,得到m個(gè)樣本的采樣集,初始訓(xùn)練集中約有63.2%的樣本出現(xiàn)在采樣集中。

Bagging的基本流程

采樣出T個(gè)含m個(gè)訓(xùn)練樣本的采樣集,然后基于每個(gè)采樣集訓(xùn)練出一個(gè)基學(xué)習(xí)器,再將這些基學(xué)習(xí)器進(jìn)行結(jié)合。

Bagging
例子

1.因?yàn)槊總€(gè)樣本被選中的概率相同,所以bagging并不側(cè)重于訓(xùn)練數(shù)據(jù)集中的任何特定實(shí)例
2.從偏差-方差的角度,Bagging主要關(guān)注降低方差,因此它在容易受到樣本擾動(dòng)的學(xué)習(xí)器(如不剪枝的決策樹、神經(jīng)網(wǎng)絡(luò))中效果更明顯。意思就是說(shuō)不容易受極端樣本影響,因?yàn)樽詈笫峭镀钡?,所以降低了方?/p>

Bias-Variance
隨機(jī)森林(Random Forest RF)

RF在以決策樹為基學(xué)習(xí)器構(gòu)建Bagging集成的基礎(chǔ)上,進(jìn)一步在決策樹的訓(xùn)練過程中引入了隨機(jī)屬性選擇。

傳統(tǒng)決策樹在選擇劃分屬性時(shí)是在當(dāng)前結(jié)點(diǎn)的屬性集合(假定有d個(gè)屬性)中選擇一個(gè)最優(yōu)屬性;

在RF中,對(duì)基決策樹的每個(gè)結(jié)點(diǎn),先從該結(jié)點(diǎn)的屬性集合中隨機(jī)選擇一個(gè)包含k個(gè)屬性的集合,然后再?gòu)倪@個(gè)子集中選擇一個(gè)最優(yōu)屬性用于劃分。一般情況下,推薦值k=log2d

Random Forest
Boosting 和 Bagging 的區(qū)別
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 隨機(jī)森林 1. 原理 隨機(jī)森林屬于Bagging的擴(kuò)展變體 Bagging:有放回抽樣,多數(shù)表決(分類)或簡(jiǎn)單平均...
    Manfestain閱讀 794評(píng)論 0 0
  • 集成學(xué)習(xí) 原理 《機(jī)器學(xué)習(xí)》周志華 8.1 個(gè)體與集成 集成學(xué)習(xí)(ensemble learning) 通過構(gòu)建并...
    hxiaom閱讀 1,133評(píng)論 0 2
  • 8.1 個(gè)體與集成 集成學(xué)習(xí)是通過構(gòu)建并結(jié)合多個(gè)學(xué)習(xí)器來(lái)完成任務(wù)。 集成學(xué)習(xí)的一般結(jié)構(gòu):一組"個(gè)體學(xué)習(xí)器"通過某種...
    D系鼎溜閱讀 1,465評(píng)論 0 0
  • About 個(gè)人同時(shí)在簡(jiǎn)書和自制個(gè)人博客兩個(gè)地方同時(shí)更新文章,有興趣的話可以來(lái)我的博客玩呀,一般而言排版會(huì)好不少。...
    DeamoV閱讀 3,025評(píng)論 0 1
  • 車前草是女朋友起的名字。 有一天突然問到到她,你給我們以后的孩子起叫什么名字?她說(shuō)叫芣苡,在詩(shī)經(jīng)中是車前草的意思。...
    是車前草啊閱讀 568評(píng)論 0 1

友情鏈接更多精彩內(nèi)容