1. 混淆矩陣
| 實際 \ 預測 | P | N |
|---|---|---|
| P | TP | FN |
| N | FP | TN |
對于數(shù)據(jù)預測結果有下面4種情況:TP, FP, FN, TN
其中T和F表示預測的對錯,P和N表示預測的樣本的正反例。
2. 準確率(precision)和召回率(recall)
準確率和召回率的公式如下,
由公式可以看出,
Precision表示的是你預測(predict)為正例的樣本中你答對的比例,
Recall 則表示實際(ground truth)中正例的樣本中你答對的比例。
3. F1 score
F1 score是一個權衡Precision和Recall 的指標,他表示為這兩個值的調和平均。
4. Macro
當任務為多分類任務時,precision和recall的計算方式就需要權衡每一類的和
,Micro和Macro就是兩種不同的權衡方式。
對于每一類的precision和recall有:
macro的precision公式,即每一類的precision的平均,為:
macro的recall公式,即每一類的recall的平均,為:
最后macro-F1的計算公式為:
5. Micro
micro的precision公式為,
micro的recall公式為,
最后micro-F1的計算公式為
6. 分別適用場景
參考鏈接:https://www.zhihu.com/question/332571344/answer/1161271111
micro-F1:
計算方法:先計算所有類別的總的Precision和Recall,然后計算出來的F1值即為micro-F1;
使用場景:在計算公式中考慮到了每個類別的數(shù)量,所以適用于數(shù)據(jù)分布不平衡的情況;但同時因為考慮到數(shù)據(jù)的數(shù)量,所以在數(shù)據(jù)極度不平衡的情況下,數(shù)量較多數(shù)量的類會較大的影響到F1的值;
marco-F1:
計算方法:將所有類別的Precision和Recall求平均,然后計算F1值作為macro-F1;
使用場景:沒有考慮到數(shù)據(jù)的數(shù)量,所以會平等的看待每一類(因為每一類的precision和recall都在0-1之間),會相對受高precision和高recall類的影響較大;