搜狗推出“唇語識(shí)別”技術(shù),垂直場景下達(dá)到90%準(zhǔn)確率

姓名:蔣雪健? ? ? ? 學(xué)號(hào):16020130066

轉(zhuǎn)自it之家

【嵌牛導(dǎo)讀】搜狗推出了一種人機(jī)交互新技術(shù)“唇語識(shí)別”,通過機(jī)器視覺識(shí)別說話人唇部動(dòng)作,來解讀說話者所說的內(nèi)容。

【嵌牛鼻子】人機(jī)交互“唇語識(shí)別”

【嵌牛提問】唇語識(shí)別的準(zhǔn)確率有多高?又會(huì)有什么應(yīng)用?

【嵌牛正文】搜狗官方表示,通過復(fù)雜端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行中文唇語序列建模,經(jīng)過數(shù)千小時(shí)的真實(shí)唇語數(shù)據(jù)訓(xùn)練,終于取得了唇語識(shí)別效果。在非特定人開放口語測試集上,該系統(tǒng)達(dá)到60%以上的準(zhǔn)確率,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準(zhǔn)確率,在垂直場景如車載、智能家居等場景下甚至已經(jīng)達(dá)到90%的準(zhǔn)確率。

作為人機(jī)交互的形式之一,未來唇語識(shí)別技術(shù)可以輔助語音交互及圖像識(shí)別,在日常生活、安防、公益等各個(gè)領(lǐng)域?qū)崿F(xiàn)廣泛應(yīng)用。比如在車載場景下,周圍噪音過大時(shí)會(huì)對(duì)語音指令產(chǎn)生干擾,通過唇語識(shí)別技術(shù)則可以規(guī)避干擾,保證人車交互的準(zhǔn)確性和穩(wěn)定性,日常不便發(fā)聲的公共場所也可以保證說話內(nèi)容的私密性;在安防領(lǐng)域,由于目前多數(shù)監(jiān)控只有攝像頭沒有麥克風(fēng),往往只能看清嘴型卻不知道在說什么,給案情分析帶來很多難題,而唇語識(shí)別技術(shù)可以幫助公安人員獲取重要的講話信息,為公共安全提供有效支持。除此之外,唇語識(shí)別技術(shù)還能發(fā)揮巨大的公益價(jià)值,幫助先天性聽障人群或老年人,讓他們更好地理解和表達(dá)自己。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容