本文收集整理弱監(jiān)督學(xué)習(xí)和小目標(biāo)檢測(cè)方面的資料。
[TOC]
- 弱監(jiān)督學(xué)習(xí)
- 何謂弱監(jiān)督學(xué)習(xí)
- CV中的弱監(jiān)督學(xué)習(xí)
- People
- Approaches
- 小目標(biāo)檢測(cè)
- 相關(guān)算法
1.弱監(jiān)督學(xué)習(xí)
什么是弱監(jiān)督學(xué)習(xí)
弱監(jiān)督是相對(duì)強(qiáng)監(jiān)督而言的。所謂監(jiān)督簡(jiǎn)單說(shuō)就是label,那么強(qiáng)弱監(jiān)督的區(qū)別是從label方面來(lái)劃分的:
- 不完整監(jiān)督:部分樣本label缺失?!安糠帧庇卸啻??也許只有小部分樣本有l(wèi)abel。
- 粗粒度監(jiān)督:給出的label你不能說(shuō)它不對(duì),但是它不夠準(zhǔn)確。比如image-level的label是弱的,object level的標(biāo)注是強(qiáng)的。(個(gè)人覺(jué)得周的這個(gè)例子不夠完備,還應(yīng)該包括“蘋(píng)果”和“水果”這樣的弱和強(qiáng)的對(duì)比)。
- 有誤的監(jiān)督:給的label包含噪聲,甚至是錯(cuò)誤的label,比如把“行人”標(biāo)注為“汽車(chē)”。當(dāng)然有時(shí)候是因?yàn)闃颖举|(zhì)量問(wèn)題,沒(méi)法標(biāo)清楚。
不完整監(jiān)督(incomplete supervision)
通常有兩種辦法來(lái)解決這類(lèi)問(wèn)題:
- 主動(dòng)學(xué)習(xí)(active learning)
- 半監(jiān)督學(xué)習(xí)(semi-supervised learning)
粗粒度監(jiān)督
可以有一個(gè)形式化的表示。。。意思是,每個(gè)樣本是一個(gè)包(“bag”),只要包中含有正樣本,label就為1,否則label為-1。任務(wù)的目的就是,給定沒(méi)有見(jiàn)過(guò)的包,來(lái)判斷包中是否有正樣本。
所以又叫做“多實(shí)例學(xué)習(xí)”(multi-instance learning)
(個(gè)人覺(jué)得,多實(shí)例學(xué)習(xí)MIL最多算是細(xì)粒度學(xué)習(xí)的一種特例。“蘋(píng)果”標(biāo)注為“水果”這樣的標(biāo)注,不算是MIL,但我認(rèn)為也是粗粒度監(jiān)督,當(dāng)然劃分到不準(zhǔn)確監(jiān)督也可以。)
不準(zhǔn)確監(jiān)督
這部分沒(méi)看。不關(guān)注它。
CV中的弱監(jiān)督學(xué)習(xí)
從兩方面入手:關(guān)注相關(guān)學(xué)者(包括他的group);關(guān)注相關(guān)算法
People/Group
魏云超(UIUC, Postdoc)
王興剛(HUST,Assistant Professor)
Paper/Approaches
- 各種帶有“Weakly Supervised Object Detection”的標(biāo)題(或摘要)的文章(在CVPR/ICCV/ECCV上找)
- 各種Multi-instance Learning (MIL) 的文章
- BoxSup/ScribbleSup, MSRA(Kaiming He, Jifeng Dai, Jian Sun) & CUHK 等
- Weakly Supervised Object Boundaries, CVPR16, 項(xiàng)目主頁(yè), video
- YYZhu (NC16)
相關(guān)Slides
見(jiàn)微知著,弱監(jiān)督和語(yǔ)義分割(魏云超)
Towards Weakly- and Semi- Supervised Object Localization and Semantic Segmentation (VALSE2018)
Weakly-Supervised Semantic Segmentation Network with Deep Seeded Region Growing
2.小目標(biāo)檢測(cè)
1) Adaptive Object Detection Using Adjacency and Zoom Prediction (AZ-Net)
Yongxi Lu, Tara Javidi, CVPR16 oral
paper, video, code
論文基于Faster R-CNN,針對(duì)只包含少量小目標(biāo)的情況,改進(jìn)anchor生成方式:

2) Efficient Object Detection for High Resolution Images
paper
ppt
比較早的文章,改進(jìn)Fast R-CNN。給我的insight大概是:先downsample,以及多路處理?比較engineering的感覺(jué)。

3.Reference
[1] A brief introduction to weakly supervised learning
[2] https://zhuanlan.zhihu.com/p/34270286