-------------先介紹最核心最混淆的混淆矩陣------------------------------------------
二分類-混淆矩陣
理解三步走
- 一看到頭字母縮寫,想到這幾個單詞
第一位:True正確的,F(xiàn)alse 錯誤的
第二位:Positive 肯定的(正類), Negative 否定的(負(fù)類) - 理解代表的含義
第一位:模型判斷的對錯(形容詞,對了or錯了)
第二位:模型判斷的結(jié)果(名詞,正類or負(fù)類) -
混淆組合
模型預(yù)測是否正確.預(yù)測的結(jié)果
TP:判斷對,判斷結(jié)果是正類
TN:判斷對,判斷結(jié)果是負(fù)類
FP:判斷錯,判斷結(jié)果是正類,誤識(正類)
FN:判斷錯,判斷結(jié)果是負(fù)類,漏識(正類)
混淆矩陣
-------------基于混淆矩陣,衍生的一攬子指標(biāo)--------------------------------------
先看這個,明白了這部分可以跳過了
TPR(真正率)+ FNR(漏識率) = 1
TNR(真負(fù)率)+ FPR(誤識率) = 1
TPR(Recall)
True Positive Rate ,正類被報正類的比率,真正率
TPR = TP/(TP+FN) , 被上報為正/ 所有的正類
又叫recall,召回率,真正類率,真陽率,靈敏度(Sensitivity)
值越大越好
FNR
False Negative Rate,正類錯報為負(fù)類,漏識率(假負(fù)率)
FNR = FN /(TP+FN),錯預(yù)測為負(fù)類/所有正類
值越小越好
TNR
True Negative Rate,負(fù)類被報為負(fù)類的比率,真負(fù)率
TN = TN(TN+FP)
又叫Specific,值越大越好
FPR
False Positive Rate,負(fù)類被誤報的比率,誤識率(假正率)
FRP = FP/(TN+FP),被誤報為正/所有的負(fù)類
又叫特異度,等價于1-Specific
值越小越好
Precision
精確率,正類的比率,分子預(yù)測正確的正類,分母預(yù)測出來的正類(包含True &false)
Precision = TP / (TP + FP)
注意和TPR的區(qū)別,TPR分母是實(shí)際正類
Accuracy
正確率,與精確率的區(qū)別,不只是考慮正類,也考慮負(fù)類,整體的正確率
A = (TP+TN)/(TP+TN+FP+FN)
ROC曲線(待補(bǔ)充)
不同閾值下,F(xiàn)P-TP曲線
-------------業(yè)務(wù)擴(kuò)展使用的常用指標(biāo)---------------------------------------------------
FAR
False Accept Rate,錯誤通過率,誤識率
類FPR(false positive rate),誤識率
類 IAR(imposter Accept rate),“冒名”通過率
FRR
False Reject Rate,正確未通過率,漏識率
類FNR,F(xiàn)alse Negative Rate,正類錯報為負(fù)類,拒識率(假負(fù)率)
類SAR,Spoofing Accept Rate,“欺騙”接受率,常用于活體檢測
相似度和閾值
如對比兩張照片,算法會出一個相似度值,范圍0~100
實(shí)際產(chǎn)品會設(shè)置閾值T,1e-6 = 1*10^(-6),即百萬分之一,1e-5 十萬一
相似度值>閾值T則判定為一個人,反之則不是
閾值和指標(biāo)
一般閾值越高,誤識率越低,漏識率越高
誤識率FAR(T), 漏識率FRR(T) 都是基于T的單調(diào)函數(shù)
求逆,將FRR表示成關(guān)于FAR的函數(shù)FRR(FAR),就是ROC曲線
如百萬一指標(biāo):就是FAR= 1e-5 時,對應(yīng)的FRR(或TP)
千一95%的意思是指在FAR=0.1%的時候,可以做到TP=95%
-------------實(shí)際業(yè)務(wù)場景下理解指標(biāo)---------------------------------------------------
易用性看正類的比率,真正、漏識
安全性看負(fù)類的比率,真負(fù)、誤識
人臉識別
- 描述通過指標(biāo)(看易用性)
對外:FRR
參考:通過率、TPR、Recall - 描述誤判率(看安全性)
對外:FAR
參考:誤識率、FPR
活體檢測
- 描述對真人的通過率(看易用性)
對外:FRR
參考:真人誤檢率(真人誤殺率)、真人通過率 - 描述對攻擊的防御能力(看安全性)
對外:SAR
參考:攻擊檢出率、攻擊漏檢率 - 補(bǔ)充關(guān)于活體
活體攻擊,一般是想要識別出攻擊(圖片、頭模型、假人等),所有攻擊被定義為正類,術(shù)語常用真人誤殺、攻擊漏檢
在采集時,需采集算法容易錯的樣本
睜閉眼檢測
- 描述睜眼判斷準(zhǔn)確率
對外:FRR(睜眼誤判為閉眼)、FAR(閉眼誤判為睜眼)
參考:雙百率(當(dāng)正閉眼誤判率調(diào)節(jié)相同的情況下,誤判率為百分多少)
描述更貼切場景,少用術(shù)語類,通過率、準(zhǔn)確率;一般睜眼為正類
注意力檢測
- 描述注意力判斷的準(zhǔn)確率
對外:FRR(注視誤判非注視)、FAR(非注意誤判為注視)
參考:雙百率(當(dāng)注和非注判率調(diào)節(jié)相同的情況下,誤判率為百分多少)
描述更貼切場景,少用術(shù)語類,通過率、準(zhǔn)確率;一般注視為正類
眼嘴鼻遮擋檢測
- 描述遮擋判斷準(zhǔn)確率,一般非遮擋為正類
對外:FRR(非遮擋誤判遮擋)、FAR(遮擋誤判為遮擋)
注意場景類的,要明確好哪種場景是正類
一般期望的場景是正類
如,注視、非遮擋(雖然有個非,但是不遮擋是想要的結(jié)果)
-------------衍生衍生再衍生的可用指標(biāo)------------------------------------------------
FPPI
False Positive num Per Image 每張圖中錯誤檢索的數(shù)目,值越小越好
FPPV
FP num per Video
FPPH
FP num per Hour
FPPD
FP num per day
-------------還有什么呢,包含但不限于------------------------------------------------
存儲指標(biāo)
一般指的是模型站內(nèi)存大小,常見單位兆M
速度
計(jì)算速度,模型訓(xùn)練和預(yù)測需要的時間,處理1次需要的時間,常見單位ms(毫秒)
魯棒性
處理缺失值和異常值的能力
可拓展性
處理大數(shù)據(jù)集的能力
可解釋性
模型預(yù)測標(biāo)準(zhǔn)的可解釋性,比如決策樹產(chǎn)生的規(guī)則容易理解,而神經(jīng)網(wǎng)絡(luò)黑盒有大量參數(shù)不好理解
易集成性
模型是為了實(shí)現(xiàn)某種場景,比如手機(jī)人臉識別,要集成到手機(jī)平臺
集成的難易程度,也是甲
方考慮的因素之一
其他
比如人臉檢測,看可以兼容的角度范圍、最小人臉的pixel值、可檢測的人力數(shù)目
-------------如果指標(biāo)異常,來找找原因------------------------------------------------
測試數(shù)據(jù)量不夠?
人臉比對示例:
100人,每人1張底庫(100張底圖)10張查詢圖(1000張查詢圖)
總共對比100*1000次= 100000次
其中1000對正樣本(自己對比自己),99000對負(fù)樣本(自己對比別人)
可以看萬一的指標(biāo),但側(cè)十萬一就不太可信了
正負(fù)樣本是否均勻采樣?
正負(fù)樣本要均衡
底庫質(zhì)量不好?
這個很好理解,模糊、遮擋、跨年齡等等
數(shù)據(jù)標(biāo)注錯誤?
同個人標(biāo)注為不同人,會出現(xiàn)相似分比較高的誤識別
非采集人員的人臉混入數(shù)據(jù)集離,導(dǎo)致同一人的數(shù)據(jù)有其他的臉,出現(xiàn)相似分低的拒識別
train和val集是否干凈?
- val的干凈程度決定了模型選取的標(biāo)準(zhǔn),train集的感覺程度決定了模型的優(yōu)劣,
- 一般train比val量大,有點(diǎn)noise影響不大,有問題優(yōu)先check val集->train集
- train集清洗,可以重采樣把loss最大的部分挑出重標(biāo)注
- 清洗val集時,應(yīng)該讓數(shù)據(jù)定義更純粹,把有歧義的(需要仔細(xì)分別或憑干凈判斷)的樣本去除,除非要故意設(shè)立hard_case集
- 清洗train集時,應(yīng)該讓數(shù)據(jù)定義更符合需求,如瞇眼定義為睜眼,那就標(biāo)注為睜眼,而非去掉歧義樣本
看badcase
從難到易,定位原因
用線上demo(成熟模型基線)跑識別分?jǐn)?shù),對分
哪些情形容易出錯
大角度、遮擋(口罩、墨鏡、劉海、帽子)、模糊、低信噪比、化妝
