商用人臉關(guān)鍵點(diǎn)檢測(cè)算法比較

目前,人臉關(guān)鍵點(diǎn)檢測(cè)算法在安防,娛樂等領(lǐng)域的應(yīng)用越來越多,很多創(chuàng)業(yè)公司,BAT等大公司,直播、美顏公司等,都有自己的產(chǎn)品。我們針對(duì)較為流行的幾款人臉標(biāo)定產(chǎn)品進(jìn)行測(cè)試比對(duì),分析各家產(chǎn)品的特點(diǎn),方便技術(shù)人員學(xué)習(xí)與開發(fā)。

我們主要選擇了商湯、曠視、智云視圖、顏鑒、百度等公司的產(chǎn)品進(jìn)行測(cè)試,其中商湯、曠視、智云視圖的SDK都提供統(tǒng)一的106點(diǎn)關(guān)鍵點(diǎn),顏鑒、百度提供了在線測(cè)試,沒有離線的SDK可以提供測(cè)試,我們僅測(cè)試在線模型,作為參考。

人臉關(guān)鍵點(diǎn)檢測(cè)算法相對(duì)來說已經(jīng)比較成熟,針對(duì)2D人臉關(guān)鍵點(diǎn),我們首先回顧一下目前較好的算法。2D人臉關(guān)鍵點(diǎn),ERT算法采用隨機(jī)蕨的方式,速度快,但是如果追求高準(zhǔn)確度,模型較大。3000FPS算法,根據(jù)開源代碼,能夠做到300fps左右,但是同樣模型較大。主流的方式大多采用深度學(xué)習(xí)的方式,CVPR18的兩篇,一個(gè)商湯的LAB,利用邊緣信息,另外SAN,訓(xùn)練數(shù)據(jù)進(jìn)行角度等分析,這些方式都具有較好的思路,但是在移動(dòng)端的實(shí)用性不強(qiáng)。

針對(duì)移動(dòng)端106標(biāo)定,我們?cè)谧约簶?biāo)注的1000張直播數(shù)據(jù)集上進(jìn)行了測(cè)評(píng),主要測(cè)試了商湯SDK,face++ SDK,以及智云視圖的SDK。對(duì)比模型大小,運(yùn)行時(shí)間,準(zhǔn)確率。針對(duì)服務(wù)器端的準(zhǔn)確率,我們測(cè)試了face++,百度,顏鑒,由于各家的標(biāo)定數(shù)據(jù)不統(tǒng)一,我們只能給出一個(gè)主觀的比較。

商湯face landmark(2018.04)、face++ landmark(2018.09)、HyperLandmark(2018.08)

速度(華為P10):6ms 、6ms、9ms

模型大?。?.3MB,1.6MB,2.1MB

精度(平均誤差):8.3%,8.1%,9.6%

在線人臉標(biāo)定:face++,百度,顏鑒。

主觀打分(6個(gè)人),分為1-5個(gè)等級(jí),分別為(5,5,4)

部分結(jié)果展示:

TBA

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容