MixMatch半監(jiān)督學習論文分析【終于說清楚了系列1】

MixMatch: A Holistic Approach to Semi-Supervised Learning.

文章發(fā)表于NeurIPS 2019

半監(jiān)督方法的目是充分利用少量的有標數(shù)據(jù)以及大量的無標數(shù)據(jù)。
為了充分利用有標數(shù)據(jù),通常會對有標數(shù)據(jù)進行增強
為了充分利用無標數(shù)據(jù),會通過一種方法給無標數(shù)據(jù)打上人工標簽,然后就可以像有標數(shù)據(jù)一樣利用起來
MixMatch的主要步驟如下:


image.png

1.對有標數(shù)據(jù)進行增強
2.給無標數(shù)據(jù)一個人工標簽。通過對一個無標數(shù)據(jù)增強K次并輸入模型得到預測結(jié)果,對K次結(jié)果進行平均并銳化(Sharpen),得到人工標簽。值得注意的是,這里的標簽并不是one-hot的,而是一個概率分布。
3.將增強后有標數(shù)據(jù)和K個打上人工標簽的無標數(shù)據(jù)都當做是有標數(shù)據(jù),正常進行Mixup操作。

由此可見,該方法一致性正則熵最小正則(smoothness/cluster assumption)的應用。
一致性正則體現(xiàn)在將一個無標數(shù)據(jù)增強K次后打上同樣的label
熵最小正則體現(xiàn)在給無標數(shù)據(jù)一個人工標簽的過程

實驗

image.png

image.png

代碼https://github.com/google-research/mixmatch

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容