阿里云首推免費(fèi)人臉識(shí)別SDK,讓每個(gè)APP輕松擁有短視頻AR特效

早在今年五月,阿里云已經(jīng)推出了短視頻解決方案。近日,阿里云再次率先顛覆行業(yè),在業(yè)內(nèi)首推免費(fèi)的人臉識(shí)別SDK,結(jié)合其原有的短視頻能力,大大降低了人臉識(shí)別+AR特效+短視頻的入行門檻。

你所知道的人臉識(shí)別行業(yè)

提到人臉識(shí)別,大家會(huì)聯(lián)想到商業(yè)支付、身份識(shí)別、廣告投放、人機(jī)交互、系統(tǒng)公安等等眾多生活場(chǎng)景。雖然這項(xiàng)技術(shù)的研究始于20世紀(jì)60年代,但是在近年這個(gè)課題才愈發(fā)活躍。以日常生活中比較常見的場(chǎng)景——社交互動(dòng)為例,通過人臉識(shí)別、AR特效、動(dòng)圖元素的支持,可以幫助用戶打破社交壁壘,更立體化、個(gè)性化、趣味化的表達(dá)自我和分享生活點(diǎn)滴。

市面上已經(jīng)有的人臉識(shí)別SDK多數(shù)費(fèi)用高昂,動(dòng)輒幾十萬(wàn),而某些廠商號(hào)稱免費(fèi),其實(shí)也是基于網(wǎng)絡(luò)API的調(diào)用,并不適合在移動(dòng)端錄制短視頻時(shí)使用,也就無(wú)法應(yīng)用在社交場(chǎng)景之中。這讓很多想在APP中添加短視頻AR特效的團(tuán)隊(duì)望塵莫及。

阿里云聯(lián)合手淘 推出人臉識(shí)別免費(fèi)SDK

阿里云通過整合集團(tuán)資源,將手淘團(tuán)隊(duì)自研的人臉識(shí)別SDK和阿里云短視頻SDK深度融合,真正做到了不依賴于網(wǎng)絡(luò)API的實(shí)時(shí)檢測(cè)、識(shí)別、跟蹤。

目前,官網(wǎng)上的專業(yè)版短視頻SDK已經(jīng)擁有了手淘自研的人臉識(shí)別功能,實(shí)現(xiàn)了人臉識(shí)別+AR動(dòng)態(tài)貼紙的完整體驗(yàn),結(jié)合原有的短視頻采集、導(dǎo)入裁剪、編輯、合成、極速上傳、媒資管理、視頻轉(zhuǎn)碼、分發(fā)加速、播放等全鏈路能力,阿里云可以為創(chuàng)業(yè)者們提供一站式解決方案,讓每個(gè)APP輕松實(shí)現(xiàn)短視頻AR新玩法。


關(guān)鍵技術(shù)介紹及算法性能測(cè)速

我們來看看具體的應(yīng)用場(chǎng)景和技術(shù)是怎樣的,用戶在客戶端進(jìn)入拍攝畫面后,可以自行選擇搭配動(dòng)態(tài)貼紙等個(gè)性化素材,實(shí)現(xiàn)AR特效,使短視頻打造出科幻、賣萌、惡搞等不同的效果。其中主要涉及到的是人臉檢測(cè)、關(guān)鍵點(diǎn)定位、追蹤等核心技術(shù)。

第一, 人臉的檢測(cè)是用于定位視頻中的人臉,同時(shí)檢測(cè)多張人臉和處理多角度、部分遮擋人臉等復(fù)雜情況也在這一步妥善處理,從而快速、準(zhǔn)確的找到人臉。

第二, 人臉的關(guān)鍵點(diǎn)定位,則是用于已知人臉?biāo)谖恢玫幕A(chǔ)上,自動(dòng)標(biāo)注人臉的輪廓、五官位置,比如眼睛、鼻子、嘴巴、眉毛、耳朵等關(guān)鍵位置。阿里云提供人臉識(shí)別關(guān)鍵點(diǎn)個(gè)數(shù)多達(dá)68個(gè),可以更準(zhǔn)確的追蹤五官,保證用戶的體驗(yàn)。

第三, AR特效美化,根據(jù)已知的關(guān)鍵點(diǎn)位置,搭配上用戶所選的動(dòng)態(tài)貼紙,并根據(jù)捕捉不同的面部動(dòng)作來變換AR特效,達(dá)到真實(shí)互動(dòng)。

第四, 人臉追蹤,視頻是動(dòng)態(tài)而非靜止的,當(dāng)用戶臉部移動(dòng)、轉(zhuǎn)動(dòng)時(shí),阿里云SDK可以實(shí)現(xiàn)對(duì)關(guān)鍵點(diǎn)的追蹤,可識(shí)別姿態(tài)范圍為yaw±60°,pitch±45°,roll±45°,精準(zhǔn)的捕捉動(dòng)作,持續(xù)追蹤動(dòng)態(tài)貼紙和AR特效。

阿里云人臉識(shí)別SDK具有準(zhǔn)確度高的特性,通過68個(gè)關(guān)鍵點(diǎn)檢測(cè)和以上技術(shù),實(shí)現(xiàn)平均錯(cuò)誤率低于 5%,出現(xiàn)“對(duì)不上”這種尷尬場(chǎng)面的概率極低。據(jù)悉,阿里云未來也會(huì)推出商業(yè)版人臉識(shí)別的高級(jí)功能,滿足更高級(jí)客戶的需求。

在性能方面,阿里云人臉識(shí)別算法和其它廠商算法在測(cè)速上的區(qū)別如下:


注:以上測(cè)試480p的最小人臉尺寸為48*48(px);720p的最小人臉尺寸為72*72

從上表可以看出,本人臉識(shí)別算法在同樣機(jī)型、同等測(cè)試對(duì)象的條件下,測(cè)速表現(xiàn)大幅優(yōu)于業(yè)內(nèi)友商。經(jīng)過阿里云集團(tuán)手淘億級(jí)日活躍用戶產(chǎn)品的考驗(yàn),性能方面毋庸置疑。由于該算法也應(yīng)用于手淘相關(guān)業(yè)務(wù)之中,所以后續(xù)的迭代、維護(hù)都會(huì)有強(qiáng)有力的保障。


阿里云人臉識(shí)別SDK的免費(fèi)開放,給短視頻行業(yè)帶來了無(wú)限的可能性。基于阿里云,創(chuàng)業(yè)者和用戶們都有了更多新鮮的玩法,創(chuàng)新機(jī)遇隨之而來,希望整個(gè)行業(yè)能產(chǎn)生更多元、更深入的探索。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容