計(jì)算機(jī)視覺漫談2

學(xué)院:電子工程學(xué)院

學(xué)號(hào):14020199025

姓名:徐銘晟

【嵌牛導(dǎo)讀】:計(jì)算機(jī)視覺中非常熱門的一個(gè)課題就是圖像識(shí)別,在傳統(tǒng)的搜圖功能中,圖片的類標(biāo)簽往往是由圖片發(fā)布網(wǎng)頁的關(guān)鍵詞組成的,這種方式往往效果很差。在圖像識(shí)別這種技術(shù)發(fā)展起來后,搜圖等一系列基于此的應(yīng)用會(huì)有更好的發(fā)展

【嵌牛鼻子】:監(jiān)督學(xué)習(xí) KNN 圖像分類

【嵌牛正文】:

計(jì)算機(jī)視覺中非常熱門的一個(gè)課題就是圖像識(shí)別,在傳統(tǒng)的搜圖功能中,圖片的類標(biāo)簽往往是由圖片發(fā)布網(wǎng)頁的關(guān)鍵詞組成的,這種方式往往效果很差。在圖像識(shí)別這種技術(shù)發(fā)展起來后,搜圖等一系列基于此的應(yīng)用會(huì)有更好的發(fā)展。

在講具體算法之前,我們先簡(jiǎn)單介紹一下監(jiān)督學(xué)習(xí)和knn。

監(jiān)督學(xué)習(xí)是從標(biāo)記的訓(xùn)練數(shù)據(jù)來推斷一個(gè)功能的機(jī)器學(xué)習(xí)任務(wù)。具體到圖像識(shí)別這個(gè)任務(wù)中,簡(jiǎn)單的例子便是分別給機(jī)器100張貓

圖片發(fā)自簡(jiǎn)書App

圖片發(fā)自簡(jiǎn)書App


和狗的圖片,并告訴機(jī)器這張圖是貓...這張圖是狗....通過這些訓(xùn)練樣本,給機(jī)器一個(gè)判別圖片是貓還是狗的評(píng)價(jià)標(biāo)準(zhǔn)。當(dāng)我們拿出一張機(jī)器沒見過的圖片,輸給機(jī)器,機(jī)器能基于之前的訓(xùn)練數(shù)據(jù),給出一個(gè)恰當(dāng)?shù)慕Y(jié)果。

kNN分類算法是數(shù)據(jù)挖掘分類技術(shù)中最簡(jiǎn)單的方法之一。所謂K最近鄰,就是k個(gè)最近的鄰居的意思,說的是每個(gè)樣本都可以用它最接近的k個(gè)鄰居來代表。

圖片發(fā)自簡(jiǎn)書App


kNN算法的核心思想是如果一個(gè)樣本在特征空間中的k個(gè)最相鄰的樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別, kNN方法在類別決策時(shí),只與極少量的相鄰樣本有關(guān)。


簡(jiǎn)要得介紹了knn算法后如何將此算法應(yīng)用于圖像分類問題?

大家自然想到,通過判斷我們需要判斷類的圖片與訓(xùn)練樣本的相似程度,設(shè)定合理的k值,我們就可以得到基本的分類器。但是如何判斷圖片之間的相似度?

一個(gè)常用的算法即為歐式距離法。上節(jié)我們講到,一張圖片在計(jì)算機(jī)中是基于像素點(diǎn)存儲(chǔ)的,每個(gè)像素點(diǎn)即為一個(gè)數(shù)據(jù)點(diǎn),有了這個(gè)知識(shí),我們很容易想到,可以利用兩張圖片中各個(gè)像素點(diǎn)的數(shù)據(jù)差的平方加權(quán)和 來表示兩張圖片之間的歐式距離。利用歐式距離產(chǎn)生的相似度,加上knn算法,我們很容易就可以構(gòu)建出一個(gè)分類器。實(shí)踐證明,在pascal數(shù)據(jù)集中,當(dāng)設(shè)置k值為7得到的分類精度最為理想,約為25%。很容易看出這個(gè)算法的弊端,當(dāng)相同的圖片,經(jīng)過一定的平移,旋轉(zhuǎn),雖然為一樣的物體信息,兩張圖片的歐式距離相差很可能巨大。要想提升圖片識(shí)別的準(zhǔn)確率,knn算法自然是不夠的。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容