梯度下降學(xué)習(xí)

今天開始學(xué)習(xí)機(jī)器學(xué)習(xí),僅供參考的個人理解,如有錯誤望指正。

吳恩達(dá)老師講的視頻(果然b站是個學(xué)習(xí)的網(wǎng)站)https://www.bilibili.com/video/av15346993?from=search&seid=4468047430738351672

如給定f(x)=wx+b,有多組數(shù)據(jù)(xi,yi),求目標(biāo)函數(shù)F(x) 即是求w和b的最符合函數(shù)的值

可以通過計(jì)算每個(yi-f(xi))^2,進(jìn)行累加(符號不會打= =),得到一個關(guān)于w,b的函數(shù)J(w,b)


J(w,b)即為代價函數(shù),通過尋找J(w,b)的最小值,使得代價函數(shù)最小。

該函數(shù)是一個凸函數(shù),目標(biāo)是通過梯度下降,到達(dá)底部。

給定w,b初始值,通過梯度下降,每次都找到最陡峭的方向移動指定的步數(shù),直至達(dá)到底部(獲得最優(yōu)解)。

首先給定一維圖像J(w)目標(biāo)是找到一個最優(yōu)值w,使得J(w)處于最低處

首先如果對J(w)求導(dǎo)得出J'(w),函數(shù)在某一點(diǎn)的導(dǎo)數(shù)就是該函數(shù)所代表的曲線在這一點(diǎn)上的切線(圖中橙色的線)的斜率,如果J(w)延正方向值增加,那么導(dǎo)數(shù)在該點(diǎn)的值為正(斜率為正值),反正亦然。

設(shè)wa為初值,wb為第二個值,在假設(shè)一個步數(shù)n用來權(quán)衡移動的速度那么移動的函數(shù)為wb=wa-nJ'(w)。

參考w0處,J'(w)是一個正值,wb=wa-nJ'(w) ,可知wb是小于wa的,那么w的值就向左移動。當(dāng)然因?yàn)椴綌?shù)的不同,步數(shù)大了,下降的快,但接近底部時又可能直接越過該值,到達(dá)另一邊通過多次迭代,最終就得到一個接近最優(yōu)解的值。

大概就是這樣,僅供參考


那么在多維的函數(shù)中,也可以用類似的方法找到函數(shù)的“底部”,首先要知道什么是偏導(dǎo)數(shù)(高數(shù)勸退ing)

直接截圖,符號不會寫.... 那個類似反著的6的符號就是偏導(dǎo)b也可以同理進(jìn)行迭代替換

最后就可以找到三維的函數(shù)底部。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 現(xiàn)在我們設(shè)計(jì)了一個神經(jīng)網(wǎng)絡(luò),但是它怎樣通過學(xué)習(xí)來識別手寫數(shù)字呢?首先需要的是被稱為訓(xùn)練數(shù)據(jù)集的數(shù)據(jù)集合。我們將使用...
    魔法煉金術(shù)閱讀 717評論 0 2
  • 1. 從梯度下降開始 這兩天學(xué)習(xí)了機(jī)器學(xué)習(xí)課程的第二課,課程內(nèi)容是圍繞梯度下降展開的,下面就我的學(xué)習(xí)內(nèi)容做一個總結(jié)...
    Zero黑羽楓閱讀 698評論 0 3
  • 如何選擇學(xué)習(xí)率以確保梯度下降工作正常? 一般有兩種辦法: 調(diào)試梯度下降。 在x軸上繪制具有迭代次數(shù)的圖。 繪制成本...
    奈何qiao閱讀 989評論 0 0
  • 文中截圖均來自Andrew Ng 視頻,文字總結(jié)部分全為原創(chuàng)。 如何得知我們的梯度下降算法是在正常工作的 梯度下降...
    0過把火0閱讀 2,778評論 0 0
  • 在C語言中,五種基本數(shù)據(jù)類型存儲空間長度的排列順序是: A)char B)char=int<=float C)ch...
    夏天再來閱讀 4,021評論 0 2

友情鏈接更多精彩內(nèi)容