二区三区日韩视频,日韩色色a,日本免费不卡一区

轉(zhuǎn)載請注明出處

1什么是卷積神經(jīng)網(wǎng)絡(luò)(CNN)

1.1 什么是卷積操作

CNN中的卷積和數(shù)字信號處理中的卷積其實不是一回事，但有點類似。這里說的只是CNN中的卷積操作。

對圖像（或者可以表示為同樣結(jié)構(gòu)的其他數(shù)據(jù)，如文本、語音等）和濾波矩陣（一組固定的權(quán)重：因為每個神經(jīng)元的多個權(quán)重固定，所以又可以看做一個恒定的濾波器filter）做內(nèi)積（逐個元素相乘再求和）的操作就是所謂的『卷積』操作，也是卷積神經(jīng)網(wǎng)絡(luò)的名字來源。

（gif動圖見附件）

備注：

http://deeplearning.stanford.edu/wiki/index.php/Feature_extraction_using_convolution

一個很自然的想法，是filter的各個權(quán)重應該是多少？filter的size怎么??？

1.2 卷積神經(jīng)網(wǎng)絡(luò)的概念

CNN的概念最早來自于對“感受野”的研究?？茖W家對貓的視覺細胞研究發(fā)現(xiàn)，每一個視覺神經(jīng)元只處理一小塊區(qū)域的視覺圖像。即感受野（receptive field）。

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks)是一種在空間上共享參數(shù)的神經(jīng)網(wǎng)絡(luò)。通過共享參數(shù)，減少了參數(shù)的個數(shù)。卷積的圖示

備注：上圖是以“圖片”舉例，所以depth是RGB三個維度。后面我們會說到CNN也可以處理文本。用卷積來處理文本分類的要點在于怎么把文本數(shù)據(jù)準備成CNN所需要的這種固定width和height的形式。

卷積神經(jīng)網(wǎng)絡(luò)簡單講就是把一個圖片的數(shù)據(jù)傳遞給CNN，原涂層是由RGB組成，然后CNN把它的厚度加厚，長寬變小，每做一層都這樣被拉長，最后形成一個分類器：

CNN是首個成功進行多層訓練的網(wǎng)絡(luò)結(jié)構(gòu)（Lecun的LeNet5），之所以CNN能夠成為“第一個吃螃蟹”的網(wǎng)絡(luò)，除了因為LeCun作為深度學習三巨頭之一，“天生神力”，有一個不可忽視的因素或許是，CNN利用空間結(jié)構(gòu)大大減少了參數(shù)量，提高了訓練效率，避免了全連接網(wǎng)絡(luò)(FCN, full connection Network)的參數(shù)過多不好訓練、以及梯度彌散(gradient vanishment)的問題。

2CNN中的一些基本概念

卷積核

卷積核，英文名kernels,有時候也叫濾波器(filters )。卷積核是CNN的核心。從信號處理的角度而言，濾波器是對信號做頻率篩選，這里主要是空間-頻率的轉(zhuǎn)換，cnn的訓練就是找到最好的濾波器使得濾波后的信號更容易分類，還可以從模版匹配的角度看卷積，每個卷積核都可以看成一個特征模版，訓練就是為了找到最適合分類的特征模版。

問題：卷積核的大小和初始值怎么?。?/p>

feature map

每一個卷積核濾波得到的圖像就是一類特征的映射，也就是一個feature map