(比較早的文章,略寫一下科普)
-
作者采用MMD(maximum mean discrepancy)作為source domain和target domain之間的特征向量(feature vector)之間的距離的度量(metric),最小化MMD可以解決source domain和target domain之間的數(shù)據(jù)偏差(data-bias)問題:
-
網(wǎng)絡(luò)架構(gòu)(Krizhevsky architecture):
- 低5層卷積層學(xué)習(xí)source domain和target domain的共同特征
- 高層的全連接層當(dāng)中加入了MMD損失(作者是選擇在fc7層之后加入了一個(gè)"bottleneck"層(adaptaion layer),加入MMD metric損失)
- 所有的層共享權(quán)重 - source domain上加入了分類損失
- 如果分類僅僅使用source domain上的數(shù)據(jù)進(jìn)行訓(xùn)練,會(huì)導(dǎo)致過擬合,所以作者使用最小化了source domain和target domain數(shù)據(jù)上距離的特征來對(duì)分類器進(jìn)行訓(xùn)練。
-
最小化MMD(作者也稱為最大化domain-confusion):
-
再加入source domain上的分類損失:
-
adaptation 層位置的選擇(最終fc7),以及adaptation輸出的特征向量的維度的選擇(最終選擇維度256)
-
是否加入MMD損失(正則項(xiàng))






