福利视频在线播,一线综合99

1. 簡(jiǎn)介

人臉關(guān)鍵點(diǎn)檢測(cè)，是人臉識(shí)別、視頻娛樂(lè)化等應(yīng)用的基礎(chǔ)算法，用于標(biāo)定人臉輪廓及五官。研究人員大多基于300w，helen等68點(diǎn)數(shù)據(jù)集進(jìn)行算法的研究，存在訓(xùn)練集小，標(biāo)定點(diǎn)不充分等因素。目前業(yè)內(nèi)主流算法包括face++及商湯的人臉標(biāo)定sdk，支持106點(diǎn)人臉關(guān)鍵點(diǎn)標(biāo)定。北京智云視圖科技有限公司開源了一款106人臉標(biāo)定SDK，在主流android平臺(tái)每幀速度5-8ms，速度快，穩(wěn)定性高，效果與商湯及face++人臉標(biāo)定SDK效果基本一致，這里提供給大家免費(fèi)使用。

2. 開發(fā)步驟

2.1. ShuffleNet-V2

為了獲得更好的性能，近些年設(shè)計(jì)的CNN更深，更復(fù)雜，這樣明顯阻礙了模型的部署應(yīng)用。而手機(jī)端的應(yīng)用越來(lái)越廣泛，因此，一種輕量化，高效率的網(wǎng)絡(luò)——Shufflenet，應(yīng)運(yùn)而生。ECCV 2018，face++團(tuán)隊(duì)將Shufflenet-V1的升級(jí)版——Shufflenet-V2.我們改進(jìn)了Shufflenet-v2的結(jié)構(gòu)，用于關(guān)鍵點(diǎn)特征提取。

2.2. Wing Loss

Wing Loss for Robust Facial Landmark Localisation with Convolutional Neural Networks

近幾年，人臉關(guān)鍵點(diǎn)檢測(cè)大多在“由粗到精”（coarse to fine）上研究，而這篇文章則另辟蹊徑。依作者所說(shuō)，這是第一篇在人臉關(guān)鍵點(diǎn)檢測(cè)任務(wù)上對(duì)loss function進(jìn)行討論分析的文章，文章在loss function上進(jìn)行改進(jìn)，為人臉關(guān)鍵點(diǎn)檢測(cè)任務(wù)提出“專用”的loss function——Wing loss，作者的出發(fā)點(diǎn)值得借鑒。

2.3. 人臉姿態(tài)估計(jì)

人臉姿態(tài)估計(jì)，顧名思義，給定一張人臉圖像，確定其姿態(tài)，姿態(tài)由什么構(gòu)成呢？很簡(jiǎn)單（pitch，yaw，roll）三種角度，分別代表上下翻轉(zhuǎn)，左右翻轉(zhuǎn)，平面內(nèi)旋轉(zhuǎn)的角度。?

目前，人臉姿態(tài)估計(jì)有多種方法，可以分為基于模型的方法，基于表觀的方法，基于分類的方法。我之前做過(guò) 這方面的調(diào)研，調(diào)研的結(jié)果很明顯，基于模型的方法得到的效果最好，因?yàn)槠涞玫降娜四樧藨B(tài)是連續(xù)的，而另外兩種，是離散的，并且很耗時(shí)間?；谀Ｐ偷墓烙?jì)方法的前提是，手頭必須具備兩樣?xùn)|西，一個(gè)是人臉特征點(diǎn)（眼鏡，嘴巴，鼻子等處的像素位置），另外一個(gè)，是需要自己制作一個(gè)3維的，正面的“標(biāo)準(zhǔn)模型”。算法最重要的還是思想，其余諸如流程什么的，都是實(shí)現(xiàn)思想的手段而已。人臉姿態(tài)估計(jì)的思想：旋轉(zhuǎn)三維標(biāo)準(zhǔn)模型一定角度，直到模型上“三維特征點(diǎn)”的“2維投影”，與待測(cè)試圖像上的特征點(diǎn)（圖像上的特征點(diǎn)顯然是2維）盡量重合。這時(shí)候我們腦海中就應(yīng)該浮現(xiàn)出一種詭異的場(chǎng)景：在幽暗的燈光中，一個(gè)發(fā)著淡藍(lán)色光芒的人皮面具一點(diǎn)點(diǎn)的“自我調(diào)整”，突然一下子“完美無(wú)缺”的“扣在了你的臉上”。這就是人臉姿態(tài)估計(jì)的思想。參考：人臉姿態(tài)估計(jì)

2.4. 多任務(wù)學(xué)習(xí)

我們?cè)谟?xùn)練過(guò)程中，加入了多任務(wù)，包括微笑、張嘴、墨鏡、年齡、性別等屬性的識(shí)別。

3.后記

人臉標(biāo)定目前是短視頻社交、人臉識(shí)別領(lǐng)域應(yīng)用廣泛，我們旨在提供一種可行的方案，讓更多的用戶能夠體驗(yàn)新的算法帶來(lái)的效果提升，同時(shí)提供一個(gè)交流的平臺(tái)，使得更多的算法愛(ài)好者進(jìn)行交流。

開源實(shí)現(xiàn)

北京智云視圖科技有限公司

4.參考鏈接

https://blog.csdn.net/u011995719/article/details/79435615

https://blog.csdn.net/u011995719/article/details/80150508

https://github.com/lsy17096535/face-landmark