色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

<tfoot id="4gcyu"><del id="4gcyu"></del></tfoot>

<fieldset id="4gcyu"><dd id="4gcyu"></dd></fieldset><li id="4gcyu"><object id="4gcyu"></object></li>

登錄注冊寫文章

激活函數(shù)

大學(xué)生產(chǎn)品筆記

激活函數(shù)

激活函數(shù)

神經(jīng)網(wǎng)絡(luò)中使用激活函數(shù)來加入非線性因素，充分組合特征，提高模型的表達(dá)能力。

?

img

Sigmoid函數(shù)

?

1.jpg

特點

把輸入的連續(xù)實值變換為0和1之間的輸出
如果是非常大的負(fù)數(shù)，那么輸出就是0；如果是非常大的正數(shù)，輸出就是1

優(yōu)點

輸出映射在(0,1)之間，單調(diào)連續(xù)，輸出范圍有限，優(yōu)化穩(wěn)定，可以用作輸出層
求導(dǎo)容易

缺點

在深度神經(jīng)網(wǎng)絡(luò)中梯度反向傳遞時導(dǎo)致梯度爆炸和梯度消失，其中梯度爆炸發(fā)生的概率非常小，而梯度消失發(fā)生的概率比較大
其輸出并不是以0為中心
其解析式中含有冪運算，計算耗時

tanh函數(shù)

2.png

特點

取值范圍為[-1,1]
tanh在特征相差明顯時的效果會很好，在循環(huán)過程中會不斷擴大特征效果

優(yōu)點

比Sigmoid函數(shù)收斂速度更快
相比Sigmoid函數(shù)，其輸出以0為中心

缺點

并沒有改變Sigmoid函數(shù)的最大問題——由于飽和性產(chǎn)生的梯度消失

ReLU

img

特點

取最大值函數(shù) 用于隱層神經(jīng)元輸出

優(yōu)點

解決了gradient vanishing問題 (在正區(qū)間)
計算速度非?？?，只需要判斷輸入是否大于0
收斂速度遠(yuǎn)快于sigmoid和tanh

缺點

ReLU的輸出不是zero-centered
Dead ReLU Problem，指的是某些神經(jīng)元可能永遠(yuǎn)不會被激活，導(dǎo)致相應(yīng)的參數(shù)永遠(yuǎn)不能被更新

softmax

?

img

特點

用于多分類神經(jīng)網(wǎng)絡(luò)輸出如果某一個 zj 大過其他 z, 那這個映射的分量就逼近于 1,其他就逼近于 0
softmax 把一個 k 維的real value向量（a1,a2,a3,a4….）映射成一個（b1,b2,b3,b4….）其中 bi 是一個 0～1 的常數(shù)，輸出神經(jīng)元之和為 1.0，所以相當(dāng)于概率值，然后可以根據(jù) bi 的概率大小來進(jìn)行多分類的任務(wù)

優(yōu)點

計算方便形式簡單

梯度消失與梯度爆炸

淺層的梯度計算需要后面各層的權(quán)重及激活函數(shù)導(dǎo)數(shù)的乘積,因此可能出現(xiàn)前層比后層的學(xué)習(xí)率小(vanishing gradient)或大(exploding)的問題,所以具有不穩(wěn)定性

權(quán)重初始化
使用合適的方式初始化權(quán)重, 如ReLU使用MSRA的初始化方式, tanh使用xavier初始化方式.
激活函數(shù)選擇
激活函數(shù)要選擇ReLU等梯度累乘穩(wěn)定的.
學(xué)習(xí)率
一種訓(xùn)練優(yōu)化方式是對輸入做白化操作(包括正規(guī)化和去相關(guān)), 目的是可以選擇更大的學(xué)習(xí)率. 現(xiàn)代深度學(xué)習(xí)網(wǎng)絡(luò)中常使用Batch Normalization(包括正規(guī)化步驟,但不含去相關(guān)). (All you need is a good init. If you can't find the good init, use Batch Normalization.)

激活函數(shù)選擇

首先嘗試ReLU,速度快,但要注意訓(xùn)練的狀態(tài).
如果ReLU效果欠佳,嘗試Leaky ReLU或Maxout等變種。
嘗試tanh正切函數(shù)(以零點為中心,零點處梯度為1)
sigmoid/tanh在RNN（LSTM、注意力機制等）結(jié)構(gòu)中有所應(yīng)用，作為門控或者概率值.
在淺層神經(jīng)網(wǎng)絡(luò)中，如不超過4層的，可選擇使用多種激勵函數(shù)，沒有太大的影響。

最后編輯于：2020.01.04 14:37:25

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容

贊1贊

贊賞

手機看全文

仙桃市| 潮安县| 德庆县| 望江县| 永定县| 醴陵市| 万盛区| 汪清县| 潞西市| 龙游县| 理塘县| 容城县| 文成县| 宁陵县| 洪雅县| 富蕴县| 门源| 乐安县| 贺州市| 公主岭市| 峡江县| 于都县| 石狮市| 微山县| 句容市| 霍林郭勒市| 垣曲县| 准格尔旗| 瓦房店市| 高尔夫| 广元市| 浦江县| 奇台县| 怀集县| 依兰县| 藁城市| 莆田市| 高陵县| 冀州市| 汝州市| 从江县|

<dfn id="uksag"></dfn>

<code id="uksag"><dd id="uksag"></dd></code>