通過刪除神經(jīng)元來了解深度學習

姓名:張安琪 ?學號:17021211235

轉(zhuǎn)載自:https://www.leiphone.com/news/201803/PJH0q2tj8d3jvVIk.html,有刪節(jié)。

【嵌牛導讀】:深度神經(jīng)網(wǎng)絡由許多單獨的神經(jīng)元組成,它們以復雜且違反人直覺的方式組合起來,以解決各種具有挑戰(zhàn)性的任務。這種復雜性一方面賦予神經(jīng)網(wǎng)絡神秘力量,另一方面,也讓它們變成了人類難懂的黑匣子。

【嵌牛鼻子】:深度學習 神經(jīng)網(wǎng)絡

【嵌牛提問】:什么是深度學習

【嵌牛正文】:

了解神經(jīng)網(wǎng)絡的深層功能對于解釋它們是如何做決定至關重要,并且能幫我們構(gòu)建更強大的系統(tǒng)。就像,你不了解各個齒輪如何配合工作,你在試圖做一個鐘表時就很困難。

要想理解神經(jīng)科學和深度學習中的神經(jīng)網(wǎng)絡,一種方法是弄清單個神經(jīng)元的作用,尤其是那些易于解釋的神經(jīng)元。

DeepMind最新的一篇關于神經(jīng)網(wǎng)絡學習的論文《On the Importance of Single Directions for Generalization》(https://arxiv.org/abs/1803.06959)將投稿在第六屆 ICLR(國際學習表征會議)。這項研究所采用的方法是受數(shù)十年臨床神經(jīng)系統(tǒng)科學的啟發(fā),通過探索損傷神經(jīng)元的影響來確定小規(guī)模神經(jīng)元組對神經(jīng)網(wǎng)絡的重要性。深度神經(jīng)網(wǎng)絡中的那些越容易解釋的神經(jīng)元對神經(jīng)網(wǎng)絡的計算性能越重要嗎?

研究人員通過刪除單個神經(jīng)元或神經(jīng)元組來衡量它是否對網(wǎng)絡的性能產(chǎn)生了影響。這項實驗有了兩個令人驚訝的發(fā)現(xiàn):

雖然以前的許多研究集中于易理解,可解釋的單個神經(jīng)元(例如「貓神經(jīng)元」,或深層網(wǎng)絡的隱藏層中的神經(jīng)元,它們只對貓的圖像有反應),但我們發(fā)現(xiàn)這些可解釋的神經(jīng)元和那些難以理解,不可描述的神經(jīng)元對神經(jīng)網(wǎng)絡的影響,并沒什么不同。

在同樣刪除神經(jīng)元的情況下,能正確分類沒見過的圖像的網(wǎng)絡比僅能對看到過的圖像進行分類的網(wǎng)絡恢復的更快。換句話說,推理性好的網(wǎng)絡比那些單純的記憶網(wǎng)絡更不依賴于單一方向。

「貓神經(jīng)元」可能更易解釋,但它們并不重要

在神經(jīng)科學和深度學習中,廣泛分析了僅對單一輸入類別的圖像(例如狗)作出響應的易解釋神經(jīng)元(「選擇性」神經(jīng)元)。這導致了在深度學習中對貓神經(jīng)元,情緒神經(jīng)元和括號神經(jīng)元過度強調(diào)它們的重要性; 在神經(jīng)科學中,對例如詹妮弗安妮斯頓神經(jīng)元,以及一些類似的神經(jīng)元的過度強調(diào)等等。然而,這些占少數(shù)的高選擇性神經(jīng)元,以及大多數(shù)低選擇性、更令人費解且難以解釋的神經(jīng)元之間,哪種相對更重要仍然未知。

原句好拗口啊……

具有明顯響應模式(例如,對貓活躍,對其他所有活動不活躍)的神經(jīng)元比那些隨著圖像隨機活動或不活動的令人難理解的神經(jīng)元更容易解釋。

為了評估神經(jīng)元的重要性,研究人員測量了當神經(jīng)元被刪除時,圖像分類任務的網(wǎng)絡性能是如何變化。 如果一個神經(jīng)元是非常重要的,刪除它應該是具有高度破壞性的并且大大降低網(wǎng)絡性能,而刪除一個不重要的神經(jīng)元應該沒有什么影響。 神經(jīng)科學家經(jīng)常進行類似的實驗,盡管它們很難在人造神經(jīng)網(wǎng)絡中獲得這些實驗所必需的細粒度和精確度。

上圖是在一個簡單神經(jīng)網(wǎng)絡上刪除神經(jīng)元產(chǎn)生影響的概念圖,較深的神經(jīng)元更活躍。 ?需要注意的是,刪除一個或兩個神經(jīng)元對輸出影響很小,而刪除大部分神經(jīng)元會產(chǎn)生很大的影響,并且一些神經(jīng)元比其他神經(jīng)元更重要!

令人驚訝的是,研究員發(fā)現(xiàn)神經(jīng)網(wǎng)絡的選擇和重要性之間幾乎沒有關系。換句話說,「貓神經(jīng)元」并不比令人難解的神經(jīng)元更重要。這一發(fā)現(xiàn)與最近在神經(jīng)科學方面的工作相呼應,已經(jīng)證明令人難解的神經(jīng)元實際上可以提供豐富的信息,并且表明今后在探索上必須超越最易于解釋的神經(jīng)元,以便理解深度神經(jīng)網(wǎng)絡。

雖然「貓神經(jīng)元」可能更易解釋,但它們并不比那些難解釋,沒有明顯偏好的神經(jīng)元更重要。 上圖反映了我們所期望的重要性和解釋性之間的不同關系!

盡管可解釋神經(jīng)元在直覺上更容易理解(比如,「它喜歡狗」),但它們并沒有比那些沒有明顯偏好的難解釋神經(jīng)元更重要。

推理性好的網(wǎng)絡很難打破

我們試圖構(gòu)建智能系統(tǒng),如果系統(tǒng)能夠推理出新的場景,我們只能稱之為系統(tǒng)智能。例如,一個圖像分類網(wǎng)絡只能對以前看過的特定狗圖像進行分類,而不能對同一只狗的新圖像進行分類,這個網(wǎng)絡是沒有價值的。只有在新樣本中依然能智能分類,這些系統(tǒng)才能獲得它們的效用。去年,Google Brain、Berkeley 和 DeepMind 合作的論文在 ICLR 2017 上獲得最佳論文,表明深層網(wǎng)絡可以簡單地記住他們接受訓練的每個圖像,而不是以更像人類的方式在學習(例如,了解抽象的「狗」概念)。

然而,網(wǎng)絡是否已經(jīng)學會了一種能夠推理到新的任務場景中的解決方案,這往往是不清楚的。通過逐漸刪除越來越大的神經(jīng)元組,研究員發(fā)現(xiàn),相比于簡單記憶在訓練期間看到的圖像的網(wǎng)絡,具有良好泛化能力的網(wǎng)絡對刪除神經(jīng)元組后的穩(wěn)健性要強得多。換句話說,泛化好的網(wǎng)絡很難被打破(盡管它們肯定還是會被打破的)。

通過以這種方式衡量網(wǎng)絡的穩(wěn)健性,可以評估一個網(wǎng)絡是否在利用簡單的記憶來「欺騙」人類。了解網(wǎng)絡在記憶過程中是如何變化的將有助于建立新網(wǎng)絡,網(wǎng)絡記憶越少,推理性就越強。

神經(jīng)科學啟發(fā)分析

總之,這些發(fā)現(xiàn)證明了使用基于臨床神經(jīng)科學啟發(fā)的技術來理解神經(jīng)網(wǎng)絡的力量是可行的。 使用這些方法,發(fā)現(xiàn)高選擇性個體神經(jīng)元并不比非選擇性神經(jīng)元更重要,并且那些廣義的網(wǎng)絡比單純記憶訓練數(shù)據(jù)的網(wǎng)絡更不依賴于單個神經(jīng)元。 這些結(jié)果意味著單個神經(jīng)元的重要性可能看起來的那么重要。通過努力解釋所有神經(jīng)元的作用,而不僅僅是那些易于解釋的神經(jīng)元,我們希望更好地理解神經(jīng)網(wǎng)絡的內(nèi)部工作,最關鍵的是,利用這種理解來構(gòu)建更加智能和通用的系統(tǒng)。

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

  • 上次我們談到了現(xiàn)在流行表揚,是不是就不應該批評了呢?當然不是,正確的批評同樣是成長的好機會,千萬不要把現(xiàn)在中國孩...
    渠笨笨閱讀 567評論 0 4
  • 遲行大道周,蕭然忽喪我。 昔時不可憶,長恨杳難掇。 薄梗風欲斷,來雁入江河。 借問陌上人,胡爲成遠客。 徘徊能已盡...
    青璞閱讀 291評論 1 2
  • 很多時候我們在做自己認為理所應當或者有意義的事情時,覺得別人的犧牲都是應該的。 我一個室友最近看了《我在故宮修文物...
    嘆了個戲閱讀 456評論 0 0

友情鏈接更多精彩內(nèi)容