這篇論文是現(xiàn)代CNN網(wǎng)絡(luò)的鼻祖。
1. 引言
人類對大腦中模式識別的機制知之甚少,想要通過傳統(tǒng)的生理學(xué)實驗來揭露它(模型識別機制)似乎也不太可能。其中最著名的實驗是Hubel和Wiesel在上世紀(jì)50年代做的貓的視覺皮層相關(guān)實驗。研究人員們提出了許多神經(jīng)網(wǎng)絡(luò)模型,試圖模型大腦中的神經(jīng)系統(tǒng),用于視覺模式識別(visual pattern recognition)。
這篇論文之前,已提出的神經(jīng)網(wǎng)絡(luò)模型的輸出響應(yīng)(response)嚴(yán)重地受到輸入模式(input patterns,比如圖像)中位置平移(shift in position)和形狀畸變(distortion in shape)的影響,這些模型的泛化性能普遍不高。
這篇論文中,作者提出了一個改進的神經(jīng)網(wǎng)絡(luò)模型,稱為神經(jīng)認(rèn)知機(Neocognitron),該模型是作者在1975年提出的稱為認(rèn)知機(Cognitron)的多層神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上的擴展。據(jù)說該模型受到了脊椎動物的視覺神經(jīng)系統(tǒng)的影響。重點是該模型具有位置特征的平移不變性,而且對形狀的輕微畸變不敏感。
根據(jù)Hubel和Wiesel發(fā)現(xiàn)的層級模型(hierarchy model),大腦視覺皮層中的神經(jīng)網(wǎng)絡(luò)是一個層級架構(gòu),即從低級細(xì)胞-->高級細(xì)胞。越高級的細(xì)胞選擇性地響應(yīng)輸入模式中越復(fù)雜的特征,同時擁有更大的感受野(receptive field),而且對輸入模式中的位置平移越不敏感。
2. 網(wǎng)絡(luò)結(jié)構(gòu)
待續(xù)。。。