機器學習中的評價指標
簡要介紹精度、精確率、召回率、P-R曲線、F1 值、TPR、FPR、ROC、AUC等指標,還有在生物領(lǐng)域常用的敏感性、特異性指標。
基礎(chǔ)
在分類任務(wù)中,各指標的計算基礎(chǔ)都來自于對正負樣本的分類結(jié)果,用混淆矩陣表示為:

混淆矩陣.png
精度
- Accuracy
定義:(TP+TN)/(TP+FN+FP+TN)
即所有分類正確的樣本占全部樣本的比例
精確率
- Precision、查準率
定義:(TP)/(TP+FP)
即預(yù)測是正例的結(jié)果中,確實是正例的比例
召回率
- Recall、查全率
定義:(TP)/(TP+FN)
即所有正例的樣本中,被找出的比例
P-R曲線
- PRC
定義:根據(jù)預(yù)測結(jié)果將預(yù)測樣本排序,最有可能為正樣本的在前,最不可能的在后,依次將樣本預(yù)測為正樣本,分別計算當前的精確率和召回率,繪制P-R曲線。

PR曲線.png
F1 值
定義:(2 * P * R)/(P + R)
TPR
- 真正例率,與召回率相同
定義:(TP)/(TP+FN)
FPR
- 假正例率
定義:(FP)/(TN+FP)
ROC
- 受試者工作特征
定義:根據(jù)預(yù)測結(jié)果將預(yù)測樣本排序,最有可能為正樣本的在前,最不可能的在后,依次將樣本預(yù)測為正樣本,分別計算當前的TPR和FPR,繪制ROC曲線。

ROC.png
AUC
- Area Under ROC Curve
定義:ROC曲線下的面積
敏感性
- sensitivity
定義:TP / (TP + FN)
即有病(陽性)人群中,檢測出陽性的幾率。(檢測出確實有病的能力)
特異性
- specificity
定義:TN / (TN + FP)
即無?。幮裕┤巳褐校瑱z測出陰性的幾率。(檢測出確實沒病的能力)
參考資料
https://blog.csdn.net/b876144622/article/details/80009867
https://www.cnblogs.com/leezx/p/6105212.html