什么是卷積神經(jīng)網(wǎng)絡(luò)

哈嘍,大家好,今天來讓我們了解下什么是卷及神經(jīng)網(wǎng)絡(luò),在這篇文章中,我會(huì)介紹什么是卷積神經(jīng)網(wǎng)絡(luò),以及卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)和某些具體的應(yīng)用。話不多說,馬上進(jìn)入正題。

卷積神經(jīng)網(wǎng)絡(luò)是近些年來興起的一種人工網(wǎng)絡(luò)結(jié)構(gòu),因?yàn)槔镁矸e神經(jīng)網(wǎng)絡(luò)在圖片和語言方面能夠給出更優(yōu)秀的結(jié)果,因此呢,這種技術(shù)也被廣泛的傳播和應(yīng)用。卷積神經(jīng)網(wǎng)絡(luò)最常用的部分是計(jì)算機(jī)圖片識(shí)別。不過因?yàn)樗牟粩鄤?chuàng)新和不斷地迭代也被廣泛的用于了視頻分析,自然語言處理,藥物發(fā)現(xiàn)等等。近期很火的阿爾法狗能讓計(jì)算機(jī)看懂圍棋,這也是利用了這門技術(shù)。

那現(xiàn)在讓我們概括下卷積神經(jīng)網(wǎng)絡(luò)是如何運(yùn)作的吧。舉一個(gè)圖片識(shí)別的例子。我們知道人體的神經(jīng)網(wǎng)絡(luò)是由很多層神經(jīng)層和神經(jīng)結(jié)構(gòu)組成,多層神經(jīng)層里邊會(huì)有很多的神經(jīng)元。這些神經(jīng)元就是神經(jīng)網(wǎng)絡(luò)識(shí)別事物的關(guān)鍵。每一種神經(jīng)網(wǎng)絡(luò)都會(huì)有他的輸入和輸出值。當(dāng)輸入值是圖片的時(shí)候,輸入的實(shí)際上并不是那些色彩繽紛的圖案,而是一堆堆的數(shù)字。當(dāng)計(jì)算機(jī)的神經(jīng)元要處理這么多信息的時(shí)候,這也就是卷積神經(jīng)網(wǎng)絡(luò)可以發(fā)揮他的優(yōu)勢的地方了。那么什么是卷積神經(jīng)網(wǎng)絡(luò)呢?那我們現(xiàn)在先把卷積神經(jīng)網(wǎng)絡(luò)這個(gè)詞分開。卷積和神經(jīng)網(wǎng)絡(luò)。卷積呢,其實(shí)就是計(jì)算機(jī)不再對(duì)每個(gè)輸入的像素做單獨(dú)的處理,而是對(duì)圖片上每一小塊的圖片上像素區(qū)域進(jìn)行處理,這種做法加強(qiáng)了圖片信息的連續(xù)性,使得神經(jīng)網(wǎng)絡(luò)可以看到圖形而非一個(gè)點(diǎn),這種做法實(shí)際上也加深了卷積神經(jīng)網(wǎng)絡(luò)對(duì)于圖片的理解。具體來說,卷積神經(jīng)網(wǎng)絡(luò)有一個(gè)批量過濾器,持續(xù)不斷的在圖片上滾動(dòng)手機(jī)圖片上的信息,每一次手機(jī)上來的信息都只是這一塊上的一些像素區(qū)域,然后把手機(jī)上來的信息進(jìn)行整理。這個(gè)時(shí)候整理的信息有了一個(gè)具體的實(shí)現(xiàn)。比如說這個(gè)時(shí)候的卷積神經(jīng)網(wǎng)絡(luò)可以看到一些邊緣上的圖片信息。然后就用同樣的步驟,用批量過濾器去批量處理邊緣信息。神經(jīng)網(wǎng)絡(luò)用這些邊緣信息總結(jié)出更高層的神經(jīng)結(jié)果,比如說總結(jié)的邊緣信息可以總結(jié)出眼睛鼻子等等,再經(jīng)過一次過濾,臉部的特征信息也會(huì)被過濾總結(jié)出來。最后我們?cè)侔堰@些收集的信息放入到普通的全連接神經(jīng)網(wǎng)絡(luò)中進(jìn)行分類,這樣就能夠得到輸入的圖片信息能夠達(dá)到哪一種結(jié)果了。

那么我們現(xiàn)在來看看圖片是如何被卷積的吧。

現(xiàn)在給你一種圖片,圖片有長寬高三個(gè)參數(shù)。對(duì),你沒有看錯(cuò),圖片是有高度的。這里的高是屬于計(jì)算機(jī)產(chǎn)生顏色的信息。如果是黑白照片的化。圖片的高度只有1.如果是彩色照片的話,圖片就會(huì)有紅綠藍(lán)三種顏色的三種信息。這時(shí)圖片的高度為3.我們以彩色圖片為例子,過濾器實(shí)際上就是在圖片上不斷移動(dòng)的掃描儀。它不斷不斷的在圖像上收集小批量的像素塊。當(dāng)收集完畢后,我們可以得到一個(gè)高度更高,更寬,更小的圖片。這個(gè)圖片里包含了一些邊緣信息,然后以同樣的步驟來進(jìn)行多次卷積處理,對(duì)圖片進(jìn)行長寬高的壓縮,使得圖像上的更多的邊緣信息可以展現(xiàn),將普通的壓縮分類放入到神經(jīng)系統(tǒng)中。這樣就可以對(duì)圖片有了更深的理解,這樣也就完成了對(duì)圖片分類的要求。

不過研究發(fā)現(xiàn),在卷積神經(jīng)網(wǎng)絡(luò)壓縮文件中,神經(jīng)網(wǎng)絡(luò)可能會(huì)無意識(shí)的丟掉一些信息。這個(gè)時(shí)候遲化(Pooling)算法就可以很好地解決這個(gè)問題,就是在卷積的時(shí)候不壓縮長寬,盡量保證更多的信息,壓縮的工作就交給遲化算法。這樣的一項(xiàng)復(fù)雜工作就可以很有效的提高系統(tǒng)的識(shí)別準(zhǔn)確性,有了這些技術(shù),我們就可以很好地搭建起一個(gè)屬于我們的卷積神經(jīng)網(wǎng)絡(luò)了。比較流行的一種搭建卷積神經(jīng)網(wǎng)絡(luò)的方法就會(huì)我圖片中的一種方法,具體的就不詳細(xì)的概述了。

好了,這一次只是對(duì)卷積神經(jīng)網(wǎng)絡(luò)對(duì)于圖片處理上的一個(gè)簡單的介紹,真正的卷積神經(jīng)網(wǎng)絡(luò)遠(yuǎn)比這個(gè)復(fù)雜的多。如果你想知道如何用Python如何搭建自己的卷積神經(jīng)網(wǎng)絡(luò),我會(huì)把視頻鏈接發(fā)送給你。也歡迎大家關(guān)注我的簡書頻道,獲得更多有趣有意思的機(jī)器學(xué)習(xí)的學(xué)習(xí)的知識(shí)


圖片發(fā)自簡書App


圖片發(fā)自簡書App
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容