Logistic Regression

logistics regression步驟:

step1:


圖1-hx.png
圖2-g(z).png

我們可以從圖2中得出:
當(dāng)z>=0,g(z)>=0.5,h(x)=1;
當(dāng)z<0,g(z)<0.5,h(x)=0;

hx=sigmoid(z)

step2:
cost function


圖3-J(theta).png

計(jì)算代價(jià)函數(shù)

step3:
gradient descent


gradient_descent.png

同步更新theta

step4:
optimization algorithm
使用高級(jí)算法來(lái)計(jì)算出theta,得出minJ(θ)
需要傳入的數(shù)據(jù)有:


QQ20180308-143158@2x.png
options = optimset(‘GradObj’, ‘on’, ‘MaxIter’, ‘100’); 
initialTheta = zeros(2,1); 
optTheta, functionVal, exitFlag] = fminunc(@costFunction, initialTheta, options);

返回計(jì)算得出的theta。

  • Regularized Linear Regression

然而有時(shí)候因?yàn)閠heta太多,會(huì)導(dǎo)致過(guò)擬合。
這時(shí)候就需要使用正則化,來(lái)防止過(guò)擬合。

regularization.png

就是在線(xiàn)性回歸的cost function中添加theta^2*lambda的和
在這里新引入了lambda參數(shù)
如果lambda非常大,那么就會(huì)減小theta對(duì)函數(shù)的影響,
theta的值就越小,最終只剩theta(0),而hx就變成了一條直線(xiàn),完全的欠擬合。

gradient_descent.png

現(xiàn)在我們需要計(jì)算出theta的值,參照線(xiàn)性回歸的gradient descent
我們把theta(0)單獨(dú)提取出來(lái),因?yàn)樗蝗ジ淖兲刭|(zhì)值(x(0)=1)。


reg_gradient_descent.png

gradient descent在加入正則化之后的公式。

我們?cè)賹?duì)公式稍加整理得出:


theta_j_reg.png
  • Normal Equation
    如果我們想要用正規(guī)方程求出theta
    先回顧下在線(xiàn)性回歸中的normal equation:


    normal_equation.png

在正則化中,我們對(duì)方程做出修改:


normal_equation_reg.png

L是一個(gè)(n+1)*(n+1)的矩陣,其中第一行第一列的為0,也就是對(duì)theta(0)不做影響。
這樣既可求出theta。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀(guān)點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容