https://www.boyuai.com/elites/
Task09:目標檢測基礎(chǔ);圖像風格遷移;圖像分類案例1
一、目標檢測基礎(chǔ)
1、錨框
目標檢測算法怎樣實現(xiàn)? 1、區(qū)域采樣 2、判斷區(qū)域中是否包含我們感興趣的目標 3、調(diào)整區(qū)域邊緣? 的功能?
錨框(anchor box)是以每個像素為中心生成多個大小和寬高比(aspect ratio)不同的邊界框。
區(qū)域采樣:畫出圖像中以某個像素為中心的所有錨框
判斷區(qū)域中是否包含我們感興趣的目標
調(diào)整區(qū)域邊緣
算法工程師的技能點是否包含自己寫工具函數(shù)?如:
生成錨框的方法已實現(xiàn)在`MultiBoxPrior`函數(shù)中。指定輸入、一組大小和一組寬高比,該函數(shù)將返回輸入的所有錨框。
為了描繪圖像中以某個像素為中心的所有錨框,我們先定義`show_bboxes`函數(shù)以便在圖像上畫出多個邊界框。
算法工程師的技能點:1、熟悉算法平臺如pytorch、熟悉函數(shù)庫如numpy、熟悉算法平臺和函數(shù)庫中的工具函數(shù)用法;2、自己會寫一些工具函數(shù)如MultiBoxPrior、show_bboxes;3、掌握機器學習、深度學習算法推導(dǎo)和理解需要的統(tǒng)計學基礎(chǔ);4、能夠復(fù)現(xiàn)最新發(fā)表的文章中算法;5、改動現(xiàn)有算法以服務(wù)于當前業(yè)務(wù)。
將Jaccard系數(shù)稱為交并比(Intersection over Union,IoU),即兩個邊界框相交面積與相并面積之比。

1.1? 生成多個錨框
1.2 標注訓(xùn)練集的錨框
1.3?輸出預(yù)測邊界框
在訓(xùn)練集中,我們將每個錨框視為一個訓(xùn)練樣本。為了訓(xùn)練目標檢測模型,我們需要為每個錨框標注兩類標簽:一是錨框所含目標的類別,簡稱類別;二是真實邊界框相對錨框的偏移量,簡稱偏移量(offset)。
在目標檢測時,我們首先生成多個錨框,然后為每個錨框預(yù)測類別以及偏移量,接著根據(jù)預(yù)測的偏移量調(diào)整錨框位置從而得到預(yù)測邊界框,最后篩選需要輸出的預(yù)測邊界框。
算法圖文描述:

之后可以標注錨框的類別和偏移量。

這個算法體現(xiàn)了從程序員業(yè)門檻,也是自己欠缺的。
根據(jù)錨框與真實邊界框在圖像中的位置來分析這些標注的類別。

2、多尺度目標檢測
減少錨框個數(shù),方法1在輸入圖像中均勻采樣一小部分像素,并以采樣的像素為中心生成錨框;方法2在不同尺度下,生成不同數(shù)量和不同大小的錨框。
較小目標比較大目標在圖像上出現(xiàn)位置的可能性更多。因此,當使用較小錨框來檢測較小目標時,我們可以采樣較多的區(qū)域;而當使用較大錨框來檢測較大目標時,我們可以采樣較少的區(qū)域。
課后習題:



沒徹底完成算法實踐,約花費2小時。
二、圖像風格遷移
三、圖像分類案例1