談?wù)劜闇?zhǔn)率(Precision)和查全率(Recall)

書接上文:

之前為什么說自己浮躁?因?yàn)檫B最基本的機(jī)器學(xué)習(xí)模型性能評(píng)估最基本的的查全率和查準(zhǔn)率都搞不清楚,還妄想搞機(jī)器學(xué)習(xí)。
今天,就來解決這個(gè)基礎(chǔ)問題。

通俗的理解

在二分問題的情況下(非對即錯(cuò),非0即1):
查準(zhǔn)率(Precision)就是你認(rèn)為是對的樣例中,到底有多少真是對的。
查全率(Recall)就是所有對的樣例,你找出了多少,或者說你判斷對了多少。

公式

總之,下面這個(gè)矩陣:

真實(shí)情況↓模型預(yù)測→ True False
True TP FN
False FP TN

囊括了所有樣例
其中,查準(zhǔn)率Precision:
Precision=\frac{TP}{(TP+FP)}
查全率:
Precision=\frac{TP}{(TP+FN)}

簡單總結(jié)

一般來說,查全查準(zhǔn)不可兼得,除非在一些簡單任務(wù)中。
很好理解,做出正預(yù)測多,查全率必然上升,但查準(zhǔn)率就要下降。
反之,盡量少預(yù)測,查準(zhǔn)率必然高,但是查全率要低很多。

F1度量

F1度量是基于查準(zhǔn)率和查全率的調(diào)和平均(harmonic mean)定義的:
\frac{1}{F1}=\frac{1}{2}\cdot (\frac{1}{P}+\frac{1}{R})
F1=\frac{2\times P\times R}{P+R}=\frac{2\times TP}{2\times TP+FP+FN}
相比于算術(shù)平均和幾何平均,調(diào)和平均更注重較小值。

F_\beta度量

F_\beta是加權(quán)調(diào)和平均,是F1度量的一般形式:
\frac{1}{F_\beta}=\frac{1}{1+\beta^2}\cdot (\frac{1}{P}+\frac{\beta^2}{R})
這個(gè)等有空再更新解釋。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容