序
本次記錄如下:
RMSE、MAE、MAPE、R-Square
RMSE
(均方根誤差)
均方根誤差是用來(lái)衡量觀測(cè)值同真值之間的偏差,其計(jì)算方式類(lèi)似于L2范數(shù),因此RMSE對(duì)異常值較為敏感,因此該損失函數(shù)會(huì)對(duì)噪聲點(diǎn)賦予給高的權(quán)重,也就是要犧牲一些正常點(diǎn)的預(yù)測(cè)精度。

MAE
(平均絕對(duì)誤差)
其計(jì)算方式類(lèi)似于L1范數(shù),更好地反應(yīng)預(yù)測(cè)值誤差的真實(shí)情況,也就是反映了模型的準(zhǔn)確性

MAE相對(duì)于RMSE或是MSE來(lái)說(shuō),更偏向預(yù)測(cè)那些正常點(diǎn),也就是變化幅度不大的點(diǎn),因此在有噪聲數(shù)據(jù)干擾的情況下,可選用MAE。
使用MAE損失(特別是對(duì)于神經(jīng)網(wǎng)絡(luò))的一個(gè)大問(wèn)題是它的梯度始終是相同的,這意味著即使對(duì)于小的損失值,其梯度也是大的。這對(duì)模型的學(xué)習(xí)可不好。為了解決這個(gè)問(wèn)題,我們可以使用隨著接近最小值而減小的動(dòng)態(tài)學(xué)習(xí)率。
MAPE
(平均絕對(duì)百分誤差)
MAPE不僅考慮了真實(shí)值與預(yù)測(cè)值之間的誤差,同時(shí)考慮了誤差與真實(shí)值之間的比例,也就是很好地評(píng)價(jià)了模型的穩(wěn)定性。
例如0.5預(yù)測(cè)為1,5.0預(yù)測(cè)為4.5,這兩個(gè)之間的差距是跟大的,不單單是都只相差0.5
因此,對(duì)于不同區(qū)域的不同時(shí)間段,其base值不同,mape指標(biāo)較好地刻畫(huà)了模型對(duì)于不同區(qū)域不同時(shí)段的預(yù)測(cè)穩(wěn)定性。
R-Square
利用數(shù)據(jù)擬合一個(gè)模型,你的模型肯定是存在誤差的,那么回歸方程對(duì)觀測(cè)值擬合的怎么樣,就叫做擬合優(yōu)度,這里的R-square,就是度量擬合優(yōu)度的一個(gè)統(tǒng)計(jì)量,即常說(shuō)的r方,它叫做可決系數(shù),它的計(jì)算方法為:

看這個(gè)式子式用1減去y對(duì)回歸方程的方差(未解釋離差)與y的總方差的比值,y減去y尖也就是殘差,是擬合方程中不能解釋的部分,用1減去不能解釋的部分,那么剩下的就是解釋的部分,也就是說(shuō)自變量解釋了因變量變動(dòng)的百分比的多少,那么r方的值肯定是越大越好,意味著該模型把y的變動(dòng)解釋得好,R方的范圍顯然是0到1,在預(yù)測(cè)實(shí)踐中,人們往往采納R方最高的模型。如果結(jié)果是 0,說(shuō)明模型擬合效果很差;如果結(jié)果是 1,說(shuō)明模型無(wú)錯(cuò)誤。一般來(lái)說(shuō),R-Squared 越大,表示模型擬合效果越好。R-Squared 反映的是大概有多準(zhǔn),因?yàn)?,隨著樣本數(shù)量的增加,R-Square必然增加,無(wú)法真正定量說(shuō)明準(zhǔn)確程度,只能大概定量。
除此之外,擬合優(yōu)度還有另一個(gè)測(cè)定指標(biāo)是相關(guān)系數(shù),相關(guān)系數(shù)的公式:

相關(guān)系數(shù)有正負(fù),正意味著因變量隨自變量遞增,擬合直線(xiàn)從左到右上升,反之意味著遞減,從左到右下降。相關(guān)系數(shù)的意義不像可決系數(shù)那樣明顯,但也有類(lèi)似的意義,與可決系數(shù)同理,它越接近于+1或者-1,擬合程度越好。
對(duì)比
直觀來(lái)說(shuō),我們可以像這樣考慮:對(duì)所有的觀測(cè)數(shù)據(jù),如果我們只給一個(gè)預(yù)測(cè)結(jié)果來(lái)最小化MSE,那么該預(yù)測(cè)值應(yīng)該是所有目標(biāo)值的均值。但是如果我們?cè)噲D最小化MAE,那么這個(gè)預(yù)測(cè)就是所有目標(biāo)值的中位數(shù)。我們知道中位數(shù)對(duì)于離群點(diǎn)比平均值更魯棒,這使得MAE比MSE更加魯棒。
如果離群點(diǎn)是會(huì)影響業(yè)務(wù)、而且是應(yīng)該被檢測(cè)到的異常值,那么我們應(yīng)該使用MSE。另一方面,如果我們認(rèn)為離群點(diǎn)僅僅代表數(shù)據(jù)損壞,那么我們應(yīng)該選擇MAE作為損失。
轉(zhuǎn)載注明:http://www.itdecent.cn/p/da3b86a40635