集成方法-1·When Does Diversity Help Generalization in Classification Ensembles

G. Wang, T. Zhou, K. -S. Choi and J. Lu, "A Deep-Ensemble-Level-Based Interpretable Takagi-Sugeno-Kang Fuzzy Classifier for Imbalanced Data," in IEEE Transactions on Cybernetics, doi: 10.1109/TCYB.2020.3016972.

摘要:研究三個(gè)問(wèn)題:1)集成方法中成員的多樣性度量,2)多樣性與泛化性能的關(guān)系,3)基于度量的集成成員剪枝。

引言

  • 多樣性度量現(xiàn)狀:基于回歸的集成中,通過(guò)誤差分解來(lái)度量多樣性。誤差分解基于準(zhǔn)確率和多樣性,以及基于偏差和方差分解。僅適用于L2損失的回歸任務(wù)。
  • 多樣性和泛化性能關(guān)系:有相反的結(jié)論,各自有實(shí)驗(yàn)結(jié)果支撐。
  • 提出基于多樣性的集成剪枝方法,提出準(zhǔn)確率和多樣性的平衡框架。

貢獻(xiàn)

  • 提出多樣性度量
  • 分析多樣性和泛化性能間的關(guān)系,闡明集成多樣性泛化的范圍
  • 提出集成剪枝方法

相關(guān)工作

  1. 面向集成的單分類(lèi)器多樣性
  • 現(xiàn)有的多樣性更多的是通過(guò)調(diào)整輸入樣本的分布來(lái)完成,很少通過(guò)輸出標(biāo)簽來(lái)完成。
  • 深度網(wǎng)絡(luò)的多樣性:初始化參數(shù)、網(wǎng)絡(luò)結(jié)構(gòu)、學(xué)習(xí)優(yōu)化算法。
  1. 集成中的多樣性
  • 度量方法分類(lèi):主流包括基于成對(duì)比較的多樣性度量、非成對(duì)比較的多樣性度量。其他包括與集成的總體比較等。
  1. 多樣性在集成學(xué)習(xí)中的作用
  • 基于信息理論的角度
  • 能夠降低假設(shè)空間的復(fù)雜度
  1. 集成剪枝
  • 基于排序(評(píng)估函數(shù))、基于聚類(lèi)(預(yù)測(cè)相似性)以及基于不同優(yōu)化目標(biāo)的成員選擇方法
  • 基于統(tǒng)計(jì)、基于動(dòng)態(tài)選擇的方法

方法

概要:使用誤差分解的方法,計(jì)算與單分類(lèi)器與集成分類(lèi)器的錯(cuò)誤差異作為度量。

具體方法和實(shí)驗(yàn)先留坑

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 集成學(xué)習(xí) 原理 《機(jī)器學(xué)習(xí)》周志華 8.1 個(gè)體與集成 集成學(xué)習(xí)(ensemble learning) 通過(guò)構(gòu)建并...
    hxiaom閱讀 1,133評(píng)論 0 2
  • 集成學(xué)習(xí) 個(gè)體與集成 集成學(xué)習(xí)通過(guò)構(gòu)造多個(gè)學(xué)習(xí)器來(lái)完成學(xué)習(xí)任務(wù)。集成學(xué)習(xí)的構(gòu)造是先產(chǎn)生一組個(gè)體學(xué)習(xí)器,然后用某種策...
    edwin1993閱讀 890評(píng)論 0 0
  • 各種集成方法比較 1. AdaBoost和RF AdaBoost改變了訓(xùn)練數(shù)據(jù)的權(quán)值,即樣本的概率分布,減少上一輪...
    木子十千閱讀 1,013評(píng)論 0 1
  • 1 為什么要對(duì)特征做歸一化 特征歸一化是將所有特征都統(tǒng)一到一個(gè)大致相同的數(shù)值區(qū)間內(nèi),通常為[0,1]。常用的特征歸...
    顧子豪閱讀 7,124評(píng)論 2 22
  • 1 為什么要對(duì)特征做歸一化 特征歸一化是將所有特征都統(tǒng)一到一個(gè)大致相同的數(shù)值區(qū)間內(nèi),通常為[0,1]。常用的特征歸...
    顧子豪閱讀 1,851評(píng)論 0 1

友情鏈接更多精彩內(nèi)容