機(jī)器學(xué)習(xí)-二分類轉(zhuǎn)多分類

之前研究的分類算法比如SVM,LR等,解決的都是二分類問題,那如果問題用有多個(gè)類別呢?二分類問題轉(zhuǎn)多分類問題,常用的策略有如下三種:

1、常見的二分類轉(zhuǎn)多分類策略

1.1一對(duì)一的策略

給定數(shù)據(jù)集D這里有N個(gè)類別,這種情況下就是將這些類別兩兩配對(duì),從而產(chǎn)生N(N?1)/2個(gè)二分類任務(wù),在測(cè)試的時(shí)候把樣本交給這些分類器,然后進(jìn)行投票

1.2一對(duì)其余策略

將每一次的一個(gè)類作為正例,其余作為反例,總共訓(xùn)練N個(gè)分類器。測(cè)試的時(shí)候若僅有一個(gè)分類器預(yù)測(cè)為正的類別則對(duì)應(yīng)的類別標(biāo)記作為最終分類結(jié)果,若有多個(gè)分類器預(yù)測(cè)為正類,則選擇置信度最大的類別作為最終分類結(jié)果。

1.3多對(duì)多分類策略

基于一種糾錯(cuò)輸出碼的分類策略,分為兩個(gè)步驟:
編碼:對(duì)N個(gè)類別做M次劃分,每次劃分將一部分類別劃為正類,一部分劃為反類,從而形成一個(gè)二分類訓(xùn)練集,這樣一共產(chǎn)生M個(gè)訓(xùn)練集,可訓(xùn)練出M個(gè)分類器

解碼M個(gè)分類器分別對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),這些預(yù)測(cè)標(biāo)記組成一個(gè)編碼。將這個(gè)預(yù)測(cè)編碼與每個(gè)類別各自的編碼進(jìn)行比較,返回其中距離最小的類別作為最終預(yù)測(cè)的結(jié)果

這里的類別劃分通過編碼矩陣指定,編碼矩陣主要有,二元碼(每個(gè)類別分別指定正類反類),三元碼(正,反,停用)

編碼示例如下圖:


一般來說編碼越長(zhǎng)則糾錯(cuò)能力越強(qiáng),但是意味著所需訓(xùn)練的分類器越多,計(jì)算存儲(chǔ)的開銷越大,不一定得到越好的訓(xùn)練效果,因?yàn)楦褬颖具M(jìn)行分組也有關(guān)系

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容