書接上文:
之前為什么說自己浮躁?因?yàn)檫B最基本的機(jī)器學(xué)習(xí)模型性能評(píng)估最基本的的查全率和查準(zhǔn)率都搞不清楚,還妄想搞機(jī)器學(xué)習(xí)。
今天,就來解決這個(gè)基礎(chǔ)問題。
通俗的理解
在二分問題的情況下(非對即錯(cuò),非0即1):
查準(zhǔn)率(Precision)就是你認(rèn)為是對的樣例中,到底有多少真是對的。
查全率(Recall)就是所有對的樣例,你找出了多少,或者說你判斷對了多少。
公式
總之,下面這個(gè)矩陣:
| 真實(shí)情況↓模型預(yù)測→ | True | False |
|---|---|---|
| True | TP | FN |
| False | FP | TN |
囊括了所有樣例
其中,查準(zhǔn)率Precision:
查全率:
簡單總結(jié)
一般來說,查全查準(zhǔn)不可兼得,除非在一些簡單任務(wù)中。
很好理解,做出正預(yù)測多,查全率必然上升,但查準(zhǔn)率就要下降。
反之,盡量少預(yù)測,查準(zhǔn)率必然高,但是查全率要低很多。
F1度量
F1度量是基于查準(zhǔn)率和查全率的調(diào)和平均(harmonic mean)定義的:
相比于算術(shù)平均和幾何平均,調(diào)和平均更注重較小值。
度量
是加權(quán)調(diào)和平均,是F1度量的一般形式:
這個(gè)等有空再更新解釋。