(1980)Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition...

這篇論文是現(xiàn)代CNN網(wǎng)絡(luò)的鼻祖。

1. 引言

人類對大腦中模式識別的機制知之甚少,想要通過傳統(tǒng)的生理學(xué)實驗來揭露它(模型識別機制)似乎也不太可能。其中最著名的實驗是Hubel和Wiesel在上世紀(jì)50年代做的貓的視覺皮層相關(guān)實驗。研究人員們提出了許多神經(jīng)網(wǎng)絡(luò)模型,試圖模型大腦中的神經(jīng)系統(tǒng),用于視覺模式識別(visual pattern recognition)。

這篇論文之前,已提出的神經(jīng)網(wǎng)絡(luò)模型的輸出響應(yīng)(response)嚴(yán)重地受到輸入模式(input patterns,比如圖像)中位置平移(shift in position)和形狀畸變(distortion in shape)的影響,這些模型的泛化性能普遍不高。

這篇論文中,作者提出了一個改進的神經(jīng)網(wǎng)絡(luò)模型,稱為神經(jīng)認(rèn)知機(Neocognitron),該模型是作者在1975年提出的稱為認(rèn)知機(Cognitron)的多層神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上的擴展。據(jù)說該模型受到了脊椎動物的視覺神經(jīng)系統(tǒng)的影響。重點是該模型具有位置特征的平移不變性,而且對形狀的輕微畸變不敏感。

根據(jù)Hubel和Wiesel發(fā)現(xiàn)的層級模型(hierarchy model),大腦視覺皮層中的神經(jīng)網(wǎng)絡(luò)是一個層級架構(gòu),即從低級細(xì)胞-->高級細(xì)胞。越高級的細(xì)胞選擇性地響應(yīng)輸入模式中越復(fù)雜的特征,同時擁有更大的感受野(receptive field),而且對輸入模式中的位置平移越不敏感。

2. 網(wǎng)絡(luò)結(jié)構(gòu)

待續(xù)。。。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容