引言
本文介紹了一些銷量預(yù)測(cè)相關(guān)的誤差指標(biāo). 它們可以被分為兩類: 絕對(duì)誤差和絕對(duì)百分比誤差. 前2節(jié)介紹銷量預(yù)測(cè)問題及相關(guān)概念. 第3節(jié)我們介紹3種絕對(duì)誤差, 并比較它們對(duì)異常值的敏感性. 由于絕對(duì)誤差不適合比較多個(gè)商品或多個(gè)時(shí)段的預(yù)測(cè)結(jié)果, 在第4節(jié)我們介紹3種百分比誤差. 在這一節(jié), 我們重點(diǎn)強(qiáng)調(diào)了它們的優(yōu)點(diǎn)和缺陷. 第5節(jié)是誤差指標(biāo)比較結(jié)果的匯總. 在第6節(jié)中, 我們用一個(gè)例子充分說明了百分比誤差容易引發(fā)的問題, 并提醒讀者在實(shí)際中必須確認(rèn)預(yù)測(cè)目標(biāo)與誤差的一致性. 在第7節(jié), 我們給出一些結(jié)論和實(shí)際使用中的建議.
1. 銷量預(yù)測(cè)
銷量預(yù)測(cè)問題是供應(yīng)鏈管理中的一個(gè)基本問題. 銷量預(yù)測(cè)可用來指導(dǎo)商品采購, 新品立項(xiàng), 銷售計(jì)劃, 庫存平衡和資源調(diào)度等業(yè)務(wù). 因此, 預(yù)測(cè)"效果"的好壞 將直接影響這些業(yè)務(wù)的質(zhì)量(注: 不同業(yè)務(wù)可能要求不同的預(yù)測(cè)"效果"). 我們一般用預(yù)測(cè)銷量和真實(shí)銷量之間的誤差來評(píng)估銷量預(yù)測(cè)結(jié)果或模型的好壞. 直觀地講, 預(yù)測(cè)銷量與真實(shí)銷量越"接近"則誤差越小, 反之則誤差越大.
為方便描述, 我們考慮如下簡(jiǎn)化的銷量預(yù)測(cè)問題.
銷量預(yù)測(cè) 預(yù)測(cè)一個(gè)商品未來1到n天的銷量. 用和
分別代表商品第
天的實(shí)際銷量和預(yù)測(cè)銷量, 其中
. 因此我們需要估計(jì)實(shí)際銷量
與預(yù)測(cè)銷量
之間的誤差.
2. 基本概念
首先考慮第天的實(shí)際銷量
和預(yù)測(cè)銷量
. 定義兩種誤差:
絕對(duì)誤差(Absolute Error):
.
絕對(duì)百分比誤差(Absolute Percentage Error):
.
我們通過一個(gè)簡(jiǎn)單的例子來比較兩種誤差.
例. 假設(shè)
.
- 絕對(duì)誤差:
優(yōu)點(diǎn)是能直接反映誤差的大小; 缺點(diǎn)是依賴標(biāo)度(Scale-dependent), 即, 它依賴觀測(cè)值的標(biāo)度(單位), 因此不適合比較不同商品或不同時(shí)段之間的誤差.
- 絕對(duì)百分比誤差:
優(yōu)點(diǎn)是不依賴標(biāo)度(Scale-free); 缺點(diǎn)是要求
, 而這個(gè)條件在實(shí)際中往往不滿足. 此外, 即使?jié)M足條件
, 當(dāng)
比較小時(shí), 容易造成
非常大(從而嚴(yán)重影響總體誤差).
3. 絕對(duì)誤差
下面考慮實(shí)際銷量與預(yù)測(cè)銷量
之間的誤差指標(biāo). 我們先介紹三種絕對(duì)誤差指標(biāo).
-
平均絕對(duì)誤差(Mean Absolute Error - MAE)
幾何平均絕對(duì)誤差(Geometric Mean Absolute Error - GMAE)
- 根均方誤差(Root Mean Square Error - RMSE)
誤差比較
- 可以證明:
. 這個(gè)關(guān)系也體現(xiàn)了它們對(duì)異常值的敏感程度(從左到右, 從高到低).
- GMAE對(duì)異常值不太敏感, 其誤差值比較穩(wěn)定, 因而適合用來比較預(yù)測(cè)模型的優(yōu)劣. 但它要求
(否則GMAE=0). 此外, 由于需要開n次根, 其計(jì)算相對(duì)MAE耗時(shí)較大.
- RMSE和MAE對(duì)異常值比較敏感. 換句話說, 單個(gè)時(shí)段的絕對(duì)誤差
可能會(huì)較大地影響整體誤差, 從而導(dǎo)致誤差值會(huì)隨著預(yù)測(cè)值的變化呈現(xiàn)較大的波動(dòng). 因此, 在使用中我們需要先剔除異常值.
- 由于絕對(duì)誤差依賴標(biāo)度, 它們不適合用來比較不同商品或不同時(shí)期預(yù)測(cè)結(jié)果的誤差水平.
4. 絕對(duì)百分比誤差
為了克服絕對(duì)誤差依賴標(biāo)度的缺點(diǎn), 一個(gè)自然的想法是考慮百分比誤差. 在實(shí)際使用中, 人們常常盲目地使用直觀易懂的誤差指標(biāo)(例如下文提到的MAPE), 并忽略了百分比誤差自身的一些缺陷, 從而導(dǎo)致誤差的降低并不能帶來期望中預(yù)測(cè)效果的提升. 本節(jié)我們重點(diǎn)強(qiáng)調(diào)絕對(duì)百分比誤差的缺陷以及使用時(shí)需要注意的事項(xiàng).
4.1 平均絕對(duì)百分比誤差(Mean Absolute Percentage Error - MAPE)
-
優(yōu)點(diǎn)
直觀, 容易計(jì)算
-
缺點(diǎn)
- 它要求
, 否則
, 從而導(dǎo)致
.
- MAPE沒有上界, 因此對(duì)異常值敏感. 當(dāng)某個(gè)
非常大時(shí), 會(huì)導(dǎo)致MAPE的值也顯著變大.
- 如果使用MAPE作為誤差評(píng)價(jià)指標(biāo),
的不對(duì)稱性會(huì)導(dǎo)致預(yù)測(cè)銷量低于實(shí)際銷量(解釋如下).
- 它要求
-
的不對(duì)稱性
給定實(shí)際銷量
, 當(dāng)預(yù)測(cè)銷量
從0變化到
時(shí), 分別考慮"低估"和"高估"時(shí)
的上界.
- 低估:
, 此時(shí)
, 即
上界為100;
- 高估:
, 此時(shí)
, 即
上界為無窮大.
由于高估會(huì)帶來較大懲罰, 為了最小化MAPE值, 算法會(huì)傾向低估, 從而導(dǎo)致預(yù)測(cè)的銷量偏低.
- 低估:
4.2 對(duì)稱的MAPE (Symmetric Mean Absolute Percentage Error - SMAPE)
為了彌補(bǔ)的不對(duì)稱性, M3-競(jìng)賽[1]和IJCAI-17[2]數(shù)據(jù)挖掘競(jìng)賽采用了所謂"對(duì)稱的"MAPE作為誤差評(píng)價(jià)指標(biāo). 定義如下:
-
優(yōu)點(diǎn)
- 始終可計(jì)算(當(dāng)
時(shí), 定義
).
- SMAPE有界, 即:
.
- 形式上滿足對(duì)稱性, 即低估和高估時(shí)
上界都是200.
- 始終可計(jì)算(當(dāng)
-
缺點(diǎn)
-
的意義不直觀, 缺乏解釋性.
- 在實(shí)際的銷量預(yù)測(cè)中, 由于銷量的上界通常是有限的(通過經(jīng)驗(yàn)可以預(yù)估), 因而即使出現(xiàn)"高估"的情形, 預(yù)測(cè)銷量
一般不會(huì)超過實(shí)際銷量的常數(shù)倍(例如不超過10倍). 從這個(gè)角度來看, 高估時(shí)誤差
的上界一般低于低估時(shí)對(duì)應(yīng)的上界. 換句話說, 低估帶來的懲罰比高估大. 因此如果使用SMAPE作為誤差指標(biāo), 其預(yù)測(cè)銷量一般會(huì)高于實(shí)際銷量.
-
4.3 反正切絕對(duì)百分比誤差(Mean Arctangent Absolute Percentage Error - MAAPE)
Sungil Kim和Heeyoung Kim[3]提出了一個(gè)有意思的誤差指標(biāo)MAAPE. 與MAPE相比, 它把理解成直角三角形中的切角(見下圖).

因此. MAAPE即為
的均值:
-
優(yōu)點(diǎn)
- 始終可計(jì)算.
- MAAPE有界, 即:
.
- 有較好的可解釋性.
-
缺點(diǎn)
- 如果用MAAPE作為誤差指標(biāo), 其預(yù)測(cè)銷量一般會(huì)低于實(shí)際銷量. (可以驗(yàn)證: 低估時(shí)
的上界為
, 而高估時(shí)對(duì)應(yīng)的上界為
.)
- 如果用MAAPE作為誤差指標(biāo), 其預(yù)測(cè)銷量一般會(huì)低于實(shí)際銷量. (可以驗(yàn)證: 低估時(shí)
5. 誤差指標(biāo)匯比較結(jié)果匯總
絕對(duì)誤差
| 誤差指標(biāo) | 中文 | 優(yōu)點(diǎn) | 缺點(diǎn) | 說明 |
|---|---|---|---|---|
| MAE | (算術(shù))平均絕對(duì)誤差 | 直觀 | 對(duì)異常值敏感 | 需要確認(rèn)預(yù)測(cè)的目標(biāo)與誤差指標(biāo)是否一致 |
| GMAE | 幾何平均絕對(duì)誤差 | 對(duì)異常值不敏感 | 1. |
需要確認(rèn)預(yù)測(cè)的目標(biāo)與誤差指標(biāo)是否一致 |
| RMSE | 根均方誤差 | - | 對(duì)異常值非常敏感 | 需要確認(rèn)基本假設(shè)(例如誤差是正態(tài)分布) |
絕對(duì)百分比誤差
| 誤差指標(biāo) | 中文 | 優(yōu)點(diǎn) | 缺點(diǎn) | 說明 |
|---|---|---|---|---|
| MAPE | 平均百分比絕對(duì)誤差 | 直觀/容易計(jì)算 | 1. 對(duì)異常值敏感; 2. |
不推薦使用 |
| SMAPE | 對(duì)稱的平均絕對(duì)百分比誤差 | 1. 始終可計(jì)算; 2.形式上對(duì)稱 | 1. 實(shí)際中預(yù)測(cè)值偏大; 2. 解釋性差 | 需要確認(rèn)預(yù)測(cè)的目標(biāo)與誤差指標(biāo)是否一致 |
| MAAPE | 平均反正切絕對(duì)百分比誤差 | 1. 始終可計(jì)算; 2. 有一定的解釋性 | 預(yù)測(cè)值偏小 | 需要確認(rèn)預(yù)測(cè)的目標(biāo)與誤差指標(biāo)是否一致 |
說明
- 在實(shí)際中我們不能盲目地使用已知的誤差指標(biāo), 也不存在"萬金油"的誤差指標(biāo). 我們采用(設(shè)計(jì))的誤差指標(biāo)必須與業(yè)務(wù)目標(biāo)一致. 即, 誤差指標(biāo)的提升會(huì)帶來業(yè)務(wù)目標(biāo)的提升.
- 使用百分比誤差時(shí), 必須注意誤差指標(biāo)會(huì)引發(fā)預(yù)測(cè)銷量比實(shí)際銷量偏小或者偏大的風(fēng)險(xiǎn).
6. 示例
我們用一個(gè)簡(jiǎn)單的例子來說明百分比誤差引起的預(yù)測(cè)值偏大或偏小的問題.
例. 假設(shè)
, 實(shí)際銷量為1-100的均勻分布, 即
, 其中
(若
, 令
). 我們的預(yù)測(cè)模型為
(
為1-100之間的整數(shù)).
下面考慮三種誤差指標(biāo)MAPE, SMAPE和MAAPE. 它們對(duì)應(yīng)的最優(yōu)預(yù)測(cè)結(jié)果如下圖所示.

| 誤差指標(biāo) | 最優(yōu)k值 | 誤差值 | 結(jié)論 |
|---|---|---|---|
| MAPE | 8 | 85.99 | 嚴(yán)重偏低(銷量的均值為50.5) |
| SMAPE | 56 | 56.33 | 偏高 |
| MAAPE | 41 | 0.5272 | 偏低 |
警告 MAPE是業(yè)界使用最多的誤差指標(biāo), 其預(yù)測(cè)模型產(chǎn)生的預(yù)測(cè)結(jié)果會(huì)明顯偏低, 因此我們?cè)谑褂弥幸欢ㄒ_認(rèn)預(yù)測(cè)目標(biāo)與誤差指標(biāo)的一致性!
7. 總結(jié)
- RMSE經(jīng)常作為預(yù)測(cè)模型的誤差指標(biāo)(損失函數(shù)), 其理論依據(jù)是建立在誤差滿足正態(tài)分布的假設(shè)下. 首先我們要驗(yàn)證用于擬合的樣本是否滿足該條件. 其次, RMSE對(duì)異常值敏感, 為了獲得穩(wěn)定的效果, 我們一般需要對(duì)數(shù)據(jù)做一些平滑處理.
- 百分比誤差MAPE(以及類似的變種)是被濫用的誤差指標(biāo). 如果你正在使用, 請(qǐng)確保業(yè)務(wù)方了解該誤差指標(biāo)帶來的風(fēng)險(xiǎn).
- 沒有萬金油的誤差指標(biāo), 應(yīng)該根據(jù)自己實(shí)際的業(yè)務(wù)目標(biāo)來確定銷量預(yù)測(cè)的誤差指標(biāo). 一個(gè)基本原則是確定誤差指標(biāo)的提升能帶來業(yè)務(wù)的提升.
- 盡量不要使用單一的目標(biāo)來衡量預(yù)測(cè)效果.
- 盡量不要使用單一的預(yù)測(cè)結(jié)果去支持多種業(yè)務(wù).
參考文獻(xiàn)
-
S. Makridakis and M. Hibon. The m3-competition: Results, conclusions and implications.
International Journal of Forecasting, 16:451-476, 2000. ? -
IJCAI' 17 Competition. https://tianchi.aliyun.com/competition/information.htm?spm=5176.100067.5678.2.2f6f5933auxKS4&raceId=231591&_lang=zh_CN ?
-
Sungil Kim and Heeyoung Kim. A new metric of absolute percentage error for intermit-
tent demand forecasts. International Journal of Forecasting, 32:669-679, 2016. ?