英文原文請(qǐng)點(diǎn)這里
譯文請(qǐng)點(diǎn)這里

文章內(nèi)容剖析
實(shí)驗(yàn)代碼在這里.

摘要
本文主要工作
- 1、闡述GAP如何使CNN具有卓越定位能力
- 2、證明了所提出網(wǎng)絡(luò)能定位出“區(qū)別性”區(qū)域,且分類效果也不差
1 介紹
擴(kuò)寫摘要,展示結(jié)果圖
- 引出GAP的功能遠(yuǎn)不止正則化,更重要的是定位能力
- 指出本文所提網(wǎng)絡(luò)保留了定位能力且分類能力也不差
1.1 相關(guān)研究(研究現(xiàn)狀)
- 已有研究證明:CNN分類能和定位能力都很好
- 介紹已有研究的兩個(gè)主要工作&提出缺陷
- 弱監(jiān)督物體定位
- 缺陷:作者并沒(méi)有評(píng)估定位能力;不是端到端的訓(xùn)練,需要額外工作,可擴(kuò)展性差
- 可視化CNN內(nèi)在表現(xiàn)
- 缺陷:只分析了卷積層,忽略了全連接層,因此是不全面的;只展示了深層特征中什么信息被保留,并沒(méi)有凸顯出這些信息的相對(duì)重要性
- 弱監(jiān)督物體定位
2 類激活圖(CAM)
作用:展示被劃分為某個(gè)特定類的“區(qū)別性”區(qū)域
網(wǎng)絡(luò)結(jié)構(gòu)
-
詳細(xì)計(jì)算推理過(guò)程
對(duì)于一個(gè)圖,用fk(x, y)代表最后一個(gè)卷積層的單元k在空間坐標(biāo)(x,y)中的激活值。對(duì)于每個(gè)單元k,通過(guò)GAP后的結(jié)果Fk為∑x,yfk(x, y)。則,對(duì)于每個(gè)類c,輸入softmax的Sc為∑kwc,kFk,wc,k代表單元k對(duì)應(yīng)的類c的權(quán)重。實(shí)際上,wc,k就是Fk對(duì)類c的重要性。最后類c的sotfmax輸出Pc為exp(Sc)/∑cexp(Sc)。這里我們忽略偏差項(xiàng):我們明確地把softmax的偏差項(xiàng)設(shè)置為0因?yàn)樗鼛缀鯇?duì)分類表現(xiàn)沒(méi)有影響。
把Fk=∑x,yfk(x, y)帶入Sc,得
公式1
我們用Mc定義類別c的CAM,則空間每個(gè)元素為
公式2
則Sc = ∑x,yMc(x,y),所以Mc(x,y)直接表明了把空間網(wǎng)格(x,y)激活對(duì)圖片劃分為類別c的的重要性。
簡(jiǎn)陋的圖 對(duì)比使用GAP 和 GMP
3 弱監(jiān)督物體定位
- 評(píng)估了CAM的定位能力
- 3.1 不同CNN網(wǎng)絡(luò)的設(shè)置
- 3.2 定位的同時(shí)不影響分類性能
4 通用的定位特征
- 我們網(wǎng)絡(luò)即使在陌生數(shù)據(jù)上(不訓(xùn)練)也能定位
- 4.1 鳥類細(xì)粒度識(shí)別與定位能力評(píng)估
- 4.2 證明GoogLeNet-GAP能用于圖片通用模式識(shí)別
5 可視化特定類單元
6 結(jié)論
- 提出CAM技術(shù)
- 證明了CAM在定位方面的泛化能力
寫作套路

摘要
開(kāi)頭
In this work, we ...
對(duì)比
While ... , we ...
介紹自己工作
Despite ... we ...
We demonstrate that our ...
最先進(jìn)的技術(shù)
state-of-the-art
研究現(xiàn)狀
引用前人研究
Recent work by xxx has shown that ...
xxx et al propose a technique/method for ...
These approaches ...
介紹自己研究
In our experiments, we found that ...
our approach is ...
xxx 遠(yuǎn)不止能做()工作,更重要的是還能()
the advantages of xxx extend beyond () - In fact, () can
we can generalize this ability beyond just ()
引出文章創(chuàng)新
However, their ...
Both of these works only analyze ... , ignoring ...
While these works can ..., they only show ...
Unlike xxx and xxx, our approach can ...
Overall, our approach provides ...
正文
開(kāi)頭
In this section, we describe the procedure for ...
技術(shù)可以用于()
This technique can be applied to do sth.
研究成功
This suggests that our approach works as expected.
通用
如圖所示
xxx is illustrated in Fig. 2.
As shown in Figure 1
如表所示
Tbl.1summarizes ...
本質(zhì)上講
In fact
Essentially, xxx indicates ...
形容表現(xiàn)的詞
remarkable ability
impressive performance
generic
連接詞
further
In general
specificly
文章參考論文

通過(guò)避免使用全連接層來(lái)減少參數(shù),保持高性能
Network In Network
GoogLeNet證明了CNN每層都是物體檢測(cè)器
Object detectors emerge in deep scene cnnsCNN在圖像識(shí)別方面做得很出色
Imagenet classi?cation with deep convolutional neural networks
Learning deep features for scene recognition using places database
Rich feature hierarchies for accurate object detection and semantic segmentationCNN在定位方面也很出色
Self-taught object localization with deep networks
Weakly supervised object localization with multi-fold multiple instance learning
Learning and transferring mid-level image representations using convolutional neural networks
Is object localization for free? weakly-supervised learning with convolutional neural networks可視化CNN
Inverting convolutional networks with convolutional networks
Understanding deep image representations by inverting them
Visualizing and understanding convolutional networks
Object detectors emerge in deep scene cnns


