“一對(duì)一”,OvO: 產(chǎn)生N(N-1)個(gè)分類器,測試時(shí),新樣本提供給所有分類器,取結(jié)果中預(yù)測最多的類別作為最終結(jié)果
“一對(duì)多”,OvR: ? 產(chǎn)生N個(gè)分類器,在預(yù)測時(shí),若只有一個(gè)分類器預(yù)測為正類,則對(duì)應(yīng)的類別標(biāo)記為最終分類結(jié)果。若有多個(gè)分類器預(yù)測為正例,則通??紤]各個(gè)分類器的預(yù)測置信度,選擇置信度最大的類別標(biāo)記作為分類結(jié)果。
"多對(duì)多',MvM: 每次將若干類作正例,剩余的作負(fù)例,不能隨便劃分,最常用的技術(shù)“ECOC” 糾錯(cuò)輸出碼;
OvO和OvR都是MvM的特例
編碼:對(duì)N 個(gè)類別做M次劃分,每次劃分將一部分類別劃為正例,一部分劃為反例,訓(xùn)練M個(gè)分類器
解碼:M個(gè)分類器分別對(duì)測試樣本進(jìn)行預(yù)測,這些預(yù)測標(biāo)記組成一個(gè)編碼,將這個(gè)預(yù)測編碼與每個(gè)類別各自的編碼進(jìn)行比較,返回其中距離最小的類別作為最終預(yù)測結(jié)果。?
詳見西瓜書P65
編碼矩陣: 二元碼:正類,反類; 三元碼:正類,反類,停用類
ECOC編碼對(duì)分類器的錯(cuò)誤有一定的容忍和修正能力,ECOC越長,糾錯(cuò)能力越強(qiáng)。
如果希望為一個(gè)樣本同時(shí)預(yù)測出多個(gè)類別標(biāo)記,這個(gè)任務(wù)就不再是多分類學(xué)習(xí),而是“多標(biāo)記學(xué)習(xí)”,這是機(jī)器學(xué)習(xí)領(lǐng)域,近年來相當(dāng)活躍的一個(gè)研究領(lǐng)域。