多分類問題

“一對(duì)一”,OvO: 產(chǎn)生N(N-1)個(gè)分類器,測試時(shí),新樣本提供給所有分類器,取結(jié)果中預(yù)測最多的類別作為最終結(jié)果

“一對(duì)多”,OvR: ? 產(chǎn)生N個(gè)分類器,在預(yù)測時(shí),若只有一個(gè)分類器預(yù)測為正類,則對(duì)應(yīng)的類別標(biāo)記為最終分類結(jié)果。若有多個(gè)分類器預(yù)測為正例,則通??紤]各個(gè)分類器的預(yù)測置信度,選擇置信度最大的類別標(biāo)記作為分類結(jié)果。


"多對(duì)多',MvM: 每次將若干類作正例,剩余的作負(fù)例,不能隨便劃分,最常用的技術(shù)“ECOC” 糾錯(cuò)輸出碼;

OvO和OvR都是MvM的特例

編碼:對(duì)N 個(gè)類別做M次劃分,每次劃分將一部分類別劃為正例,一部分劃為反例,訓(xùn)練M個(gè)分類器

解碼:M個(gè)分類器分別對(duì)測試樣本進(jìn)行預(yù)測,這些預(yù)測標(biāo)記組成一個(gè)編碼,將這個(gè)預(yù)測編碼與每個(gè)類別各自的編碼進(jìn)行比較,返回其中距離最小的類別作為最終預(yù)測結(jié)果。?

詳見西瓜書P65

編碼矩陣: 二元碼:正類,反類; 三元碼:正類,反類,停用類

ECOC編碼對(duì)分類器的錯(cuò)誤有一定的容忍和修正能力,ECOC越長,糾錯(cuò)能力越強(qiáng)。


如果希望為一個(gè)樣本同時(shí)預(yù)測出多個(gè)類別標(biāo)記,這個(gè)任務(wù)就不再是多分類學(xué)習(xí),而是“多標(biāo)記學(xué)習(xí)”,這是機(jī)器學(xué)習(xí)領(lǐng)域,近年來相當(dāng)活躍的一個(gè)研究領(lǐng)域。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 機(jī)器學(xué)習(xí) 經(jīng)驗(yàn) 數(shù)據(jù) 數(shù)據(jù)中產(chǎn)生模型model 的算法 學(xué)習(xí)算法 learning algorithm 數(shù)據(jù)集 d...
    時(shí)待吾閱讀 4,160評(píng)論 0 3
  • 一、不平衡問題 (1)不平衡數(shù)據(jù) 例如:一個(gè)產(chǎn)品生產(chǎn)的不合格產(chǎn)品數(shù)量會(huì)遠(yuǎn)低于合格產(chǎn)品數(shù)量。信用卡欺詐的檢測中,合法...
    longgb246閱讀 6,877評(píng)論 0 2
  • 機(jī)器學(xué)習(xí)是做NLP和計(jì)算機(jī)視覺這類應(yīng)用算法的基礎(chǔ),雖然現(xiàn)在深度學(xué)習(xí)模型大行其道,但是懂一些傳統(tǒng)算法的原理和它們之間...
    在河之簡閱讀 20,914評(píng)論 4 65
  • 項(xiàng)目場景: 簡歷,很多藍(lán)領(lǐng)領(lǐng)域分類多,需要根據(jù)簡歷內(nèi)容,進(jìn)行智能分類 轉(zhuǎn)轉(zhuǎn),二手物品類目380-600左右的類目,...
    活著活法閱讀 2,263評(píng)論 0 4
  • 今天我真高興,因?yàn)槲野謰屢ド衬耍衬牡胤骄驮谑型獾慕紖^(qū)的新建的橋的旁邊。我們?cè)诼愤呁A?,車下?我拿上了...
    黑夜登山閱讀 259評(píng)論 0 1

友情鏈接更多精彩內(nèi)容