提出了CCNN（Constrained CNN）：一種具有嶄新的代價(jià)方程來優(yōu)化卷積網(wǎng)絡(luò)。有任意線性約束（arbitrary linear constraints）于像素標(biāo)簽的結(jié)構(gòu)化輸出空間（structured output space of pixel labels）。卷積網(wǎng)絡(luò)非凸性讓直接優(yōu)化約束很困難，本文亮點(diǎn)就是對ground truth 標(biāo)簽做了一個(gè)分布模型，讓深度網(wǎng)絡(luò)的輸出與這個(gè)潛伏模型越接近越好。最終的目標(biāo)是一個(gè)關(guān)于線性模型的兩面凸問題（a biconvex problem for linear models）。對于深度非線性模型，變成了一個(gè)交替優(yōu)化的問題（可以用SGD解決）

Preliminaries

普通方法如下：

定義一張圖的像素級分類為

共有m類

CNN模型的概率分布為

等式右側(cè)表示把分布看成獨(dú)立的，

每一個(gè)邊界代表一個(gè)softmax概率：

標(biāo)準(zhǔn)的語義分割要求有完整的groundtruth信息，然而我們沒有。

Constrained Optimization

讓

簡寫成

CCNN的優(yōu)化可以寫成：

在輸出分布上強(qiáng)化了k個(gè)獨(dú)立的線性約束

許多QI滿足這個(gè)約束，然而所有網(wǎng)絡(luò)都用一組向量參數(shù)θ，因此將不同QI輸出空間鏈接到了一起，這樣導(dǎo)致輸出同時(shí)與輸入圖片和弱標(biāo)簽一致

作者繼續(xù)簡化它的寫法。。。：

接下來說了直接優(yōu)化很困難，可以用拉格朗日對偶，但是空間耗費(fèi)很多。因此作者介紹了一種概率分布p(x) over X label ?的語義分割。作者約束P(X)在合適的約束目標(biāo)，同時(shí)移除輸出Q的約束，讓P,Q有相同的概率分布，通過最小化KL-divergence. ：