CAT: Customized Adversarial Training for Improved Robustness
Minhao Cheng, Qi Lei, Pin-Yu Chen, Inderjit Dhillon, Cho-Jui Hsieh
arXiv preprint arXiv:2002.06789
作者提出定制化對(duì)抗訓(xùn)練(Customized Adversarial Training, CAT),通過解決和one-hot的問題改善對(duì)抗訓(xùn)練。
-
Auto-tuning
for adversarial training
的問題:不應(yīng)該為每個(gè)樣本分配相同的較大的
。一些樣本與決策邊界非常近,他們應(yīng)該使用較小的
,否則對(duì)抗訓(xùn)練將放棄這些樣本。
解決方案:在訓(xùn)練過程中為每個(gè)樣本分配一個(gè)合適的
-
Adaptive label uncertainty for adversarial training
One-hot的問題:對(duì)抗訓(xùn)練的損失促使預(yù)測(cè)匹配one-hot label(例如,二分類的[1, 0])。如果一個(gè)樣本被擾動(dòng),則預(yù)測(cè)不應(yīng)該保持one-hot。例如,如果一個(gè)樣本被干擾到?jīng)Q策邊界上,那么預(yù)測(cè)應(yīng)該為[0.5, 0.5],而不是[1, 0]。
解決方案:adaptive label smoothing。給定one-hot標(biāo)簽,對(duì)其做平滑
其中,。設(shè)
,
,則
-
the final objective function
s.t. -
CAT algorithm
CAT algorithm
