計(jì)算機(jī)視覺(jué)是在深度學(xué)習(xí)中很重要的一個(gè)任務(wù),比如說(shuō)現(xiàn)在有個(gè)圖片來(lái)了,你要知道的是這個(gè)圖片是個(gè)貓還是一個(gè)狗。這是做一件事情非?;痉诸?lèi)的任務(wù)。
現(xiàn)在說(shuō)一下計(jì)算機(jī)視覺(jué)的小知識(shí):

我們看一下這一張圖片,我們?nèi)祟?lèi)一下就看可以看出來(lái)這是一張圖片,但是這張圖片他在計(jì)算機(jī)中是怎么表示出來(lái)的呢?其實(shí)圖片在計(jì)算機(jī)中以三維矩陣的形式進(jìn)行表示的。也就是說(shuō)一張圖片可以用三維數(shù)組的形式進(jìn)行表示,這些三維的數(shù)組由一些像素點(diǎn)來(lái)組成。
比如這張圖片可以表示為300*100*3 。300我們可以理解為這是這張圖片的長(zhǎng), 100 可以理解為是這張圖片的寬 ,后面的3是 channel,是顏色通道的意思。比如說(shuō)一張彩色的圖片是RGB的形式的展現(xiàn)的,那么就是乘3.如果是一張黑白圖的話,那么是乘以1 因?yàn)樗挥幸环N顏色。
我們?cè)诳催@張圖片,在貓嘴的位置右邊我們表示出了很多數(shù)字,這些數(shù)字是什么意思呢,這些數(shù)字其實(shí)是像素點(diǎn)的意思,每個(gè)像素點(diǎn)的值是0到255之間。每個(gè)值的大小代表的是亮度,值越大代表的是越亮,值越小代表的是越黑。那么這張毛的圖片就是由這些像素點(diǎn)來(lái)組成。
通過(guò)這個(gè)例子主要是想讓大家對(duì)這個(gè)圖片有一定的了解,知道一張圖片其實(shí)是由一些像素點(diǎn)組成的,圖像是一個(gè)三維的矩陣。
我們識(shí)別一張圖片的挑戰(zhàn):





機(jī)器學(xué)習(xí)的常規(guī)套路
1收集數(shù)據(jù)并且給定標(biāo)簽(識(shí)別圖片首先你要有很多數(shù)據(jù),所以你首先要收集數(shù)據(jù),然后給這些數(shù)據(jù)打上標(biāo)簽。標(biāo)簽是什么意思呢,比如說(shuō)很多圖片,你要給這些圖片分類(lèi),如狗的在一類(lèi)貓的在一類(lèi))
2訓(xùn)練一個(gè)分類(lèi)器(比如邏輯回歸,主要做的是分類(lèi)的任務(wù))
3 測(cè)試評(píng)估(你要對(duì)分類(lèi)的結(jié)果進(jìn)行評(píng)估)
?更多內(nèi)容請(qǐng)關(guān)注公眾號(hào)Java知識(shí)局。