Wang H, Xiao R, Li Y, et al. PiCO: Contrastive Label Disambiguation for Partial Label Learning[J]. arXiv preprint arXiv:2201.08984, 2022.
摘要翻譯
在這項工作中,作者通過在一個連貫的框架中解決PLL中的兩個關鍵研究挑戰(zhàn)——表示學習和標簽消歧——來彌補這一差距。具體來說,所提出的框架PiCO由一個對比學習模塊和一個新的基于類簇原型的標簽消歧算法組成。PiCO為來自相同類簇的樣本示例生成緊密對齊的表示,并便于標簽消除歧義。
任務背景介紹

該論文主要研究的是partial label learning(PLL)問題。該問題可以定義為如下:首先給定為輸入空間,
為輸出標簽空間??紤]如下的訓練數(shù)據(jù)集
,每一個元組由一張圖片
和一個候選的標簽集合
組成。依照監(jiān)督學習任務的設定來講,PLL的目標是通過關聯(lián)樣本來學習一個可以預測正確標簽的映射函數(shù)。二者之間的不同點是,PLL的建立可以容忍標簽空間的不確定性。PLL任務的基礎假設是輸入樣本
所對應的真實標簽
是隱藏在其候選標簽集合
中的,但在學習過程中該標簽不可見。正是因為這個原因,相較于監(jiān)督學習任務中給定正確標簽而言,PLL在學習中容易受到固有歧義的影響。
可以看出,PLL任務中最關鍵的問題在于如何從給定的候選標簽集合中識別出真實標簽。在訓練中,為每個輸入圖片分配一個標準化向量
作為偽目標,向量中的每個元素表示每個標簽可能是真實標簽的概率。為
中每個標簽分配的概率之和為1。該
將會在訓練的過程中進行更新。理想情況下,
應該在訓練過程中將更大的概率放在(未知的)真實標簽
上。在訓練中,以
為目標,用交叉熵損失來訓練分類器
:


模型淺析

對于PLL任務,主要包含表示和標簽學習兩個關鍵問題,當然這兩個問題是可以進行同時優(yōu)化的。
-
表示學習
標簽空間中的不確定性使得學習有效表示遇到了障礙。在PiCO模型中,作者在等式中的分類損失(1)中結合了一個對比學習的損失項,促進了在嵌入空間中的聚類效果。作者指出,將對比學習運用到PLL中,最大的挑戰(zhàn)在于正例樣本集合的構建。
(1)訓練目標。關于對比損失項,作者采用的是MoCo和SupCon中標準的對比損失。對于給定的樣本,首先通過隨機的數(shù)據(jù)增強函數(shù)
產(chǎn)生了兩個視圖--query視圖和key視圖。然后兩張圖片分別被喂入query網(wǎng)絡
和key網(wǎng)絡
,返回一對由
標準化的嵌入表示
和
。與Moco中設置一致,key網(wǎng)絡由query動量更新。此外,作者還維護了一個存儲最新key嵌入
的隊列,并且按照時間序列更新該隊列。至此,作者給出了可以用于對比學習的embedding池:
因此,給定一個樣本,該樣本的對比損失可以由其query嵌入和對比嵌入池中的其他部分定義:
其中,為正例集合,
。
(2)正例集合的選取。作者建議使用分類器的預測標簽。并且將預測的標簽嚴格限制在候選標簽集合
中。因此正例滿足
是訓練樣本
對應的預測標簽。為了提高計算效率,作者還維護了一個標簽隊列來存儲過去的預測值。換句話說,作者將
的正例集合定義為那些攜帶相同的近似標簽預測
的樣本。
至此就可以聯(lián)合訓練分類器和對比學習的網(wǎng)絡。總體的損失函數(shù)如下:
在這種結構下,模型可以通過CL學習高質量表示的目標依賴于準確的分類器預測的正例集合選擇,這使得在存在標簽歧義的情況下,問題仍然沒有得到解決。 -
基于原型的標簽消歧技術
為了更好的解決樣本表示依賴于正例選擇的問題,作者以一種協(xié)同算法的形式引入了基于原型的標簽消歧策略。作者提出了原型嵌入(prototype embedding)向量,該向量和每個類簇
對應。利用聚類的思想,關于偽標簽的分配,一個簡單的版本是找到當前嵌入向量的最近的原型嵌入。此外,作者還通過使用移動平均樣式公式來軟化這個硬標簽分配版本。在這種前提下,可以直觀的假設原型的應用通過對比項在嵌入空間中建立了和聚類之間的關聯(lián)性。
(1)偽標簽的更新。首先作者使用均勻分布初始化偽標簽:之后通過平均移動的機制來對其進行迭代更新其中,,
是第
的類簇對應的原型嵌入。使用移動平均策略,可以平穩(wěn)地將偽目標更新到正確的目標,同時確保穩(wěn)定的訓練動態(tài)。
(2)原型的更新。
更新原型嵌入的最典型的方法是在訓練的每次迭代中計算它。然而,這將產(chǎn)生巨大的計算代價,進而導致難以忍受的訓練延遲。因此,作者提出同樣以移動平均的方式更新class-conditional原型向量:其中,類簇的動量原型嵌入
由預測類簇符合
的歸一化query嵌入
的移動平均值定義。
是用于平衡的超參數(shù)。
協(xié)同解釋
首先,由于對比項有利地表現(xiàn)出嵌入空間中的聚類效應,標簽消歧模塊通過設置更精確的原型進一步利用。其次,一組優(yōu)化的標簽消歧結果可能反過來回報正例集合的構造,這是對比學習階段的關鍵部分。
PLL任務感覺讓人很容易接受。并且在模型的構造上,雖然沒有很明顯的使用聚類的方法,但是利用對比學習捕獲聚類友好的嵌入空間表示,并且在偽標簽的更新中使用了計算當前樣本嵌入和類簇原型嵌入表示
之間的相似性來更新偽標簽,無疑中也使用了聚類中計算樣本表示和類簇中心表示的思想。巧妙的通過這種聯(lián)系,建立起樣本和標簽之間的關聯(lián)性,為PLL任務提供了很好的思路。







