《動手學深度學習》第七天2020-02-20

https://www.boyuai.com/elites/

Task09:目標檢測基礎(chǔ);圖像風格遷移;圖像分類案例1

一、目標檢測基礎(chǔ)

1、錨框

目標檢測算法怎樣實現(xiàn)? 1、區(qū)域采樣 2、判斷區(qū)域中是否包含我們感興趣的目標 3、調(diào)整區(qū)域邊緣? 的功能?

錨框(anchor box)是以每個像素為中心生成多個大小和寬高比(aspect ratio)不同的邊界框。

區(qū)域采樣:畫出圖像中以某個像素為中心的所有錨框

判斷區(qū)域中是否包含我們感興趣的目標

調(diào)整區(qū)域邊緣


算法工程師的技能點是否包含自己寫工具函數(shù)?如:

生成錨框的方法已實現(xiàn)在`MultiBoxPrior`函數(shù)中。指定輸入、一組大小和一組寬高比,該函數(shù)將返回輸入的所有錨框。

為了描繪圖像中以某個像素為中心的所有錨框,我們先定義`show_bboxes`函數(shù)以便在圖像上畫出多個邊界框。


算法工程師的技能點:1、熟悉算法平臺如pytorch、熟悉函數(shù)庫如numpy、熟悉算法平臺和函數(shù)庫中的工具函數(shù)用法;2、自己會寫一些工具函數(shù)如MultiBoxPrior、show_bboxes;3、掌握機器學習、深度學習算法推導(dǎo)和理解需要的統(tǒng)計學基礎(chǔ);4、能夠復(fù)現(xiàn)最新發(fā)表的文章中算法;5、改動現(xiàn)有算法以服務(wù)于當前業(yè)務(wù)。


將Jaccard系數(shù)稱為交并比(Intersection over Union,IoU),即兩個邊界框相交面積與相并面積之比。


1.1? 生成多個錨框

1.2 標注訓(xùn)練集的錨框

1.3?輸出預(yù)測邊界框

在訓(xùn)練集中,我們將每個錨框視為一個訓(xùn)練樣本。為了訓(xùn)練目標檢測模型,我們需要為每個錨框標注兩類標簽:一是錨框所含目標的類別,簡稱類別;二是真實邊界框相對錨框的偏移量,簡稱偏移量(offset)。

在目標檢測時,我們首先生成多個錨框,然后為每個錨框預(yù)測類別以及偏移量,接著根據(jù)預(yù)測的偏移量調(diào)整錨框位置從而得到預(yù)測邊界框,最后篩選需要輸出的預(yù)測邊界框。

算法圖文描述:

之后可以標注錨框的類別和偏移量。


這個算法體現(xiàn)了從程序員業(yè)門檻,也是自己欠缺的。


根據(jù)錨框與真實邊界框在圖像中的位置來分析這些標注的類別。


2、多尺度目標檢測

減少錨框個數(shù),方法1在輸入圖像中均勻采樣一小部分像素,并以采樣的像素為中心生成錨框;方法2在不同尺度下,生成不同數(shù)量和不同大小的錨框。

較小目標比較大目標在圖像上出現(xiàn)位置的可能性更多。因此,當使用較小錨框來檢測較小目標時,我們可以采樣較多的區(qū)域;而當使用較大錨框來檢測較大目標時,我們可以采樣較少的區(qū)域。


課后習題:

沒徹底完成算法實踐,約花費2小時。


二、圖像風格遷移

三、圖像分類案例1

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者。

友情鏈接更多精彩內(nèi)容