為什么要探索發(fā)展史(實例分析)?
我們首先來看看一些卷積神經(jīng)網(wǎng)絡(luò)的實例分析,為什么要看這些實例分析呢?
上周我們講了基本構(gòu)建,比如卷積層、池化層以及全連接層這些組件。
事實上,過去幾年計算機視覺研究中的大量研究都集中在如何把這些基本構(gòu)件組合起來,形成有效的卷積神經(jīng)網(wǎng)絡(luò)。
最直觀的方式之一就是去看一些案例,就像很多人通過看別人的代碼來學(xué)習(xí)編程一樣,通過研究別人構(gòu)建有效組件的案例是個不錯的辦法。實際上在計算機視覺任務(wù)中表現(xiàn)良好的神經(jīng)網(wǎng)絡(luò)框架往往也適用于其它任務(wù),也許你的任務(wù)也不例外。
也就是說,如果有人已經(jīng)訓(xùn)練或者計算出擅長識別貓、狗、人的神經(jīng)網(wǎng)絡(luò)或者神經(jīng)網(wǎng)絡(luò)框架,而你的計算機視覺識別任務(wù)是構(gòu)建一個自動駕駛汽車,你完全可以借鑒別人的神經(jīng)網(wǎng)絡(luò)框架來解決自己的問題。
最后,學(xué)完這幾節(jié)課,你應(yīng)該可以讀一些計算機視覺方面的研究論文了,我希望這也是你學(xué)習(xí)本課程的收獲。當然,讀論文并不是必須的,但是我希望當你發(fā)現(xiàn)你可以讀懂一些計算機視覺方面的研究論文或研討會內(nèi)容時會有一種滿足感。言歸正傳,我們進入主題。
這是后面幾節(jié)課的提綱,首先我們來看幾個經(jīng)典的網(wǎng)絡(luò)。
發(fā)展史
LeNet-5網(wǎng)絡(luò),我記得應(yīng)該是1980年代的,經(jīng)常被引用的AlexNet,還有VGG網(wǎng)絡(luò)。這些都是非常有效的神經(jīng)網(wǎng)絡(luò)范例,當中的一些思路為現(xiàn)代計算機視覺技術(shù)的發(fā)展奠定了基礎(chǔ)。論文中的這些想法可能對你大有裨益,對你的工作也可能有所幫助。然后是ResNet,又稱殘差網(wǎng)絡(luò)。
記住吶,AlexNet --> VGG --> ResNet
神經(jīng)網(wǎng)絡(luò)正在不斷加深,對此你可能有所了解。ResNet神經(jīng)網(wǎng)絡(luò)訓(xùn)練了一個深達152層的神經(jīng)網(wǎng)絡(luò),并且在如何有效訓(xùn)練方面,總結(jié)出了一些有趣的想法和竅門。
課程最后,我們還會講一個Inception神經(jīng)網(wǎng)絡(luò)的實例分析(這個是google的哦,要認真記的)。
了解了這些神經(jīng)網(wǎng)絡(luò),我相信你會對如何構(gòu)建有效的卷積神經(jīng)網(wǎng)絡(luò)更有感覺。
即使計算機視覺并不是你的主要方向,但我相信你會從ResNet和Inception網(wǎng)絡(luò)這樣的實例中找到一些不錯的想法。
這里面有很多思路都是多學(xué)科融合的產(chǎn)物。總之,即便你不打算構(gòu)建計算機視覺應(yīng)用程序,試著從中發(fā)現(xiàn)一些有趣的思路,對你的工作也會有所幫助。