深度學(xué)習(xí) - 草稿

mini-batch size = m則為批梯度下降 進(jìn)行梯度下降時(shí)處理全部的訓(xùn)練樣本,如果訓(xùn)練樣本的數(shù)據(jù)量很大,則,進(jìn)行一次梯度下降要耗費(fèi)很長時(shí)間


size=1 即為隨機(jī)梯度下降? 隨機(jī)梯度下降每次只處理訓(xùn)練樣本中的一個(gè)訓(xùn)練數(shù)據(jù) 往往只是朝著局部最優(yōu)的方向下降,噪聲比較大,隨機(jī)梯度下降不會(huì)收斂到全局的最小值只會(huì)朝著最小值方向不斷下降,失去了所有由向量化而帶來的優(yōu)勢

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容