HyperLandmark開源人臉106點(diǎn)關(guān)鍵點(diǎn)檢測(cè)SDK

1. 簡(jiǎn)介

人臉關(guān)鍵點(diǎn)檢測(cè),是人臉識(shí)別、視頻娛樂(lè)化等應(yīng)用的基礎(chǔ)算法,用于標(biāo)定人臉輪廓及五官。研究人員大多基于300w,helen等68點(diǎn)數(shù)據(jù)集進(jìn)行算法的研究,存在訓(xùn)練集小,標(biāo)定點(diǎn)不充分等因素。目前業(yè)內(nèi)主流算法包括face++及商湯的人臉標(biāo)定sdk,支持106點(diǎn)人臉關(guān)鍵點(diǎn)標(biāo)定。北京智云視圖科技有限公司開源了一款106人臉標(biāo)定SDK,在主流android平臺(tái)每幀速度5-8ms,速度快,穩(wěn)定性高,效果與商湯及face++人臉標(biāo)定SDK效果基本一致,這里提供給大家免費(fèi)使用。

2. 開發(fā)步驟

2.1. ShuffleNet-V2

為了獲得更好的性能,近些年設(shè)計(jì)的CNN更深,更復(fù)雜,這樣明顯阻礙了模型的部署應(yīng)用。而手機(jī)端的應(yīng)用越來(lái)越廣泛,因此,一種輕量化,高效率的網(wǎng)絡(luò)——Shufflenet,應(yīng)運(yùn)而生。ECCV 2018,face++團(tuán)隊(duì)將Shufflenet-V1的升級(jí)版——Shufflenet-V2.我們改進(jìn)了Shufflenet-v2的結(jié)構(gòu),用于關(guān)鍵點(diǎn)特征提取。

2.2. Wing Loss

Wing Loss for Robust Facial Landmark Localisation with Convolutional Neural Networks

近幾年,人臉關(guān)鍵點(diǎn)檢測(cè)大多在“由粗到精”(coarse to fine)上研究,而這篇文章則另辟蹊徑。依作者所說(shuō),這是第一篇在人臉關(guān)鍵點(diǎn)檢測(cè)任務(wù)上對(duì)loss function進(jìn)行討論分析的文章,文章在loss function上進(jìn)行改進(jìn),為人臉關(guān)鍵點(diǎn)檢測(cè)任務(wù)提出“專用”的loss function——Wing loss,作者的出發(fā)點(diǎn)值得借鑒。


2.3. 人臉姿態(tài)估計(jì)

人臉姿態(tài)估計(jì),顧名思義,給定一張人臉圖像,確定其姿態(tài),姿態(tài)由什么構(gòu)成呢?很簡(jiǎn)單(pitch,yaw,roll)三種角度,分別代表上下翻轉(zhuǎn),左右翻轉(zhuǎn),平面內(nèi)旋轉(zhuǎn)的角度。?


目前,人臉姿態(tài)估計(jì)有多種方法,可以分為基于模型的方法,基于表觀的方法,基于分類的方法。我之前做過(guò) 這方面的調(diào)研,調(diào)研的結(jié)果很明顯,基于模型的方法得到的效果最好,因?yàn)槠涞玫降娜四樧藨B(tài)是連續(xù)的,而另外兩種,是離散的,并且很耗時(shí)間?;谀P偷墓烙?jì)方法的前提是,手頭必須具備兩樣?xùn)|西,一個(gè)是人臉特征點(diǎn)(眼鏡,嘴巴,鼻子等處的像素位置),另外一個(gè),是需要自己制作一個(gè)3維的,正面的“標(biāo)準(zhǔn)模型”。算法最重要的還是思想,其余諸如流程什么的,都是實(shí)現(xiàn)思想的手段而已。人臉姿態(tài)估計(jì)的思想:旋轉(zhuǎn)三維標(biāo)準(zhǔn)模型一定角度,直到模型上“三維特征點(diǎn)”的“2維投影”,與待測(cè)試圖像上的特征點(diǎn)(圖像上的特征點(diǎn)顯然是2維)盡量重合。這時(shí)候我們腦海中就應(yīng)該浮現(xiàn)出一種詭異的場(chǎng)景:在幽暗的燈光中,一個(gè)發(fā)著淡藍(lán)色光芒的人皮面具一點(diǎn)點(diǎn)的“自我調(diào)整”,突然一下子“完美無(wú)缺”的“扣在了你的臉上”。這就是人臉姿態(tài)估計(jì)的思想。參考:人臉姿態(tài)估計(jì)

2.4. 多任務(wù)學(xué)習(xí)

我們?cè)谟?xùn)練過(guò)程中,加入了多任務(wù),包括微笑、張嘴、墨鏡、年齡、性別等屬性的識(shí)別。

3.后記

人臉標(biāo)定目前是短視頻社交、人臉識(shí)別領(lǐng)域應(yīng)用廣泛,我們旨在提供一種可行的方案,讓更多的用戶能夠體驗(yàn)新的算法帶來(lái)的效果提升,同時(shí)提供一個(gè)交流的平臺(tái),使得更多的算法愛(ài)好者進(jìn)行交流。

開源實(shí)現(xiàn)

北京智云視圖科技有限公司

4.參考鏈接

https://blog.csdn.net/u011995719/article/details/79435615

https://blog.csdn.net/u011995719/article/details/80150508

https://github.com/lsy17096535/face-landmark

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容