識(shí)別手寫數(shù)字的神經(jīng)網(wǎng)絡(luò)為什么需要10個(gè)輸出而不是四個(gè)?一個(gè)簡單的回答

如果輸出為四個(gè),那么輸出層的每個(gè)神經(jīng)元需要學(xué)習(xí)的是“1和2的手寫體之間的區(qū)別”之類的斷言;

如果輸出為十個(gè),那么輸出層的每個(gè)神經(jīng)元需要學(xué)習(xí)的只是“判斷一幅圖片是不是1”這樣的斷言。

而描述一個(gè)圖片是不是某個(gè)數(shù)字比描述兩個(gè)數(shù)字之間的區(qū)別容易的多。

(問題來自Neural networks and deep learning

You might wonder why we use 10 output neurons. After all, the goal of the network is to tell us which digit (0,1,2,…,9) corresponds to the input image. A seemingly natural way of doing that is to use just 44 output neurons, treating each neuron as taking on a binary value, depending on whether the neuron's output is closer to 0 or to 1. Four neurons are enough to encode the answer, since 24=16 is more than the 10 possible values for the input digit. Why should our network use 10 neurons instead? Isn't that inefficient? The ultimate justification is empirical: we can try out both network designs, and it turns out that, for this particular problem, the network with 1010output neurons learns to recognize digits better than the network with 4 output neurons. But that leaves us wonderingwhyusing 1010output neurons works better. Is there some heuristic that would tell us in advance that we should use the 10-output encoding instead of the 4-output encoding?

……

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 耿耿喜歡余淮,貝塔簡單知道 余淮喜歡耿耿,只有路星河知道 路星河喜歡耿耿,全世界都知道 簡單喜歡韓敘,只有韓敘不知...
    yangming14閱讀 230評(píng)論 0 0
  • 聽《為你讀詩》,想起還不太遙遠(yuǎn)的過去。 我和兒子都喜歡下雨的夜晚,當(dāng)然是小雨,偶爾伴著遙遠(yuǎn)低沉的雷聲更好。兒子說,...
    維C多閱讀 183評(píng)論 0 0
  • 2017年8月7日(丁酉年閏六月十六)立秋安徽休寧晨山:晴午有陣雨復(fù)轉(zhuǎn)晴 26—35° 立秋日的晨山,陽光還是那么...
    劉麗賞閱讀 396評(píng)論 1 1
  • 婚后生活的第一次重大變故多數(shù)是來自于孩子的降生,很多夫妻發(fā)現(xiàn),有了孩子之后,似乎才發(fā)現(xiàn)和對(duì)方有這么多的不一樣的觀點(diǎn)...
    熙寶愛吃飯閱讀 499評(píng)論 0 2

友情鏈接更多精彩內(nèi)容