Conditional Adversarial Domain Adaptation
來源:AAAI 2018
作者:Mingsheng Long, Zhangjie Cao, JianminWang, and Michael I. Jordan
機構:清華大學軟件學院,清華大學大數(shù)據(jù)研究中心,加州大學伯克利分校
數(shù)據(jù)集:Office-31,ImageCLEF-DA,Office-Home,Digits(MNIST,USPS,SVHN)
網(wǎng)絡結構:用AlexNet,ResNet-50作為基本的網(wǎng)絡
1.整體感受
本文的數(shù)學證明非常多,剛開始讀的時候被證明嚇住了,讀的時候拋開證明去讀,先捋清本文脈絡。
2.CDAN結構

2.1多線性映射(Multilinear Conditioning)
作者認為,分類問題本身就具有多模式分布的特性(一類就是一個分布),而分類器的預測結果g里面包含了多模式信息。因此,作者就想辦法來發(fā)掘并利用g里面的多模式信息,具體做法是改變判別器的輸入,原來的判別器輸入是特征提取器提取出的特征f,現(xiàn)在變成f和g,如何對f和g進行處理,使得我們能發(fā)掘并利用g里面的多模式信息,這是一個值得思考的問題,作者經(jīng)過一番數(shù)學理論分析,最終決定選擇f和g的多線性映射。如圖1中(a)所示。

然而,f和g的多模式映射有個問題,就是映射后的維度是二者的乘積,這個維度太大了,嵌入到深度網(wǎng)絡中會帶來參數(shù)爆炸問題。作者提出用隨機的方法來解決這一問題,加入隨機的網(wǎng)絡結構如圖1中(b)所示.


現(xiàn)在,我們?yōu)闂l件域判別器D提供了兩個選擇,什么時候用什么,作者在文中給出了一個標準。

2.2 熵(Entropy Conditioning)
作者利用熵來給每個訓練樣本賦予不同的權重,并說CDAN的變種,CDAN+E會改善可遷移性。目標函數(shù)如下:

3.CDAN目標函數(shù)


4.實驗結果




5.文中摘要:
Conditional domain adversarial networks (CDANs) are designed with two novel conditioning strategies: ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? multilinear conditioning that captures the cross-covariance between feature representations and classifier predictions to improve the discriminability, ? ? ? ? ? ? ????????????????????????????????????????????????????????????????????????????????????????????????????????????????????? and entropy conditioning that controls the uncertainty of classifier predictions to??? guarantee the transferability.以上是摘要里關于本文的描述
6.英文詞匯積累
be applicable to 適用于
be fit to 適用于
prioritize? v. 按重要性排列; 劃分優(yōu)先順序; 優(yōu)先處理
as a rule of thumb,根據(jù)經(jīng)驗