英文語(yǔ)音、方言語(yǔ)音識(shí)別樣樣精通,百度輸入法率先實(shí)現(xiàn)“語(yǔ)音自由說(shuō)”

說(shuō)起語(yǔ)音輸入法,大家都不陌生。近幾年,在手機(jī)上使用語(yǔ)音識(shí)別輸入文字的朋友已不占少數(shù),語(yǔ)音識(shí)別的精準(zhǔn)程度更是今非昔比。

據(jù)iimedia Research(艾媒咨詢)發(fā)布的《2019年上半年中國(guó)第三方手機(jī)輸入法專題研究報(bào)告》指出,2018年中國(guó)第三方手機(jī)輸入法用戶規(guī)模已超7億,預(yù)計(jì)2019年這一數(shù)字將達(dá)到7.28億,2020年達(dá)到7.43億,未來(lái)行業(yè)內(nèi)將圍繞人工智能技術(shù)升級(jí)展開(kāi)激烈的競(jìng)爭(zhēng),AI技術(shù)也將成為輸入法行業(yè)的最大變革助推力。

以百度輸入法為例,經(jīng)過(guò)長(zhǎng)時(shí)間的技術(shù)優(yōu)化和體驗(yàn)升級(jí),2019年上半年百度輸入法已擁有高達(dá)2.71億的語(yǔ)音輸入用戶數(shù)量規(guī)模,穩(wěn)居中國(guó)第三方手機(jī)輸入用戶規(guī)模的第一名,相比之下,搜狗和訊飛輸入法分別以2.47億、1.54億用戶規(guī)模居于二三位。此外,百度輸入法離線識(shí)別精度也超越了行業(yè)最高水平的15%,在線語(yǔ)音的識(shí)別精度也高于行業(yè)平均水平35%。

另一方面,憑借今年初上線的“中英自由說(shuō)”、“方言自由說(shuō)”、離在線語(yǔ)音切換等功能,百度輸入法強(qiáng)勢(shì)占據(jù)語(yǔ)音用戶占比的行業(yè)排名之首。據(jù)艾媒咨詢數(shù)據(jù)顯示,2019年上半年第三方手機(jī)輸入法用戶人均每日語(yǔ)音輸入數(shù)次的統(tǒng)計(jì)中,百度輸入法以3.28次位居第一,訊飛和搜狗輸入法分別以3.21次和2.96次位列二、三位。

簡(jiǎn)單的做個(gè)計(jì)算,可以說(shuō)每10個(gè)中國(guó)手機(jī)用戶,就會(huì)有3、4個(gè)人在使用百度輸入法的語(yǔ)音輸入功能,這與百度輸入法語(yǔ)音功能的識(shí)別準(zhǔn)確率、人性化的便捷功能是分不開(kāi)的。

不僅如此,百度輸入法除官方版(主線版)外,還有與各類廠商合作、為不同手機(jī)品牌用戶定制的版本,這種定制版更符合用戶需求。比如筆點(diǎn)君自用的主力手機(jī)小米9,其MIUI系統(tǒng)就預(yù)裝了百度輸入法小米版,該版本與小米手機(jī)最新版MIUI 10系統(tǒng)深度適配,功能與官方的“主線版”界面略有差異。

此外,百度輸入法還于2019年1月推出了擁有百度大腦眾多AI技術(shù)加持的“百度輸入法AI探索版”,如上圖右側(cè)界面所示,該版本默認(rèn)為全語(yǔ)音輸入,點(diǎn)擊語(yǔ)音即可開(kāi)啟輸入,界面清爽直接。它和百度輸入法官方版一樣,承載了百度語(yǔ)音技術(shù)的流式截?cái)嗟亩鄬幼⒁饬#⊿MLTA),將在線語(yǔ)音識(shí)別精度提升了15%,并實(shí)現(xiàn)全球首次基于Attention技術(shù)的在線語(yǔ)音識(shí)別服務(wù)的大規(guī)模上線應(yīng)用。筆點(diǎn)君特意將三個(gè)版本逐個(gè)體驗(yàn)對(duì)比,其中官方主線版是目前功能最為豐富全面的版本,點(diǎn)擊鍵盤(pán)左上角百度輸入法LOGO按鈕,即可看到6行4列、二十余個(gè)功能類別。

不知道這些功能大家有沒(méi)有挨個(gè)體驗(yàn),除了以往高頻使用的功能,其他的我都把玩一番。其中,最好用的功能自然是語(yǔ)音轉(zhuǎn)文字的識(shí)別功能,在百度輸入法主線版上,長(zhǎng)按空格鍵啟用。下圖是我用百度輸入法主線版在知乎APP上語(yǔ)音輸入撰寫(xiě)文章的過(guò)程,可以看到無(wú)論是識(shí)別速度還是準(zhǔn)確度,百度輸入法都是異常出色的。

百度輸入法不僅對(duì)普通話識(shí)別準(zhǔn)確,對(duì)多種語(yǔ)言混合輸入也是信手拈來(lái),更有離線識(shí)別、長(zhǎng)文本語(yǔ)音(想說(shuō)多久就說(shuō)多久)、智能語(yǔ)音指令、輕聲識(shí)別(小聲說(shuō)話也可以輕松識(shí)別)等功能加持。事實(shí)上,今年1月與百度輸入法AI探索版同期誕生的“流式階段多層注意力建模”(SMLTA)實(shí)現(xiàn)了兩個(gè)中文在線語(yǔ)音識(shí)別歷史上的重大突破,并基于SMLTA模型成為業(yè)內(nèi)首家實(shí)現(xiàn)“中英自由說(shuō)”,和首家實(shí)現(xiàn)“方言自由說(shuō)”的輸入法。

簡(jiǎn)言之,在不影響識(shí)別精度的前提下,百度輸入法可以自由語(yǔ)音輸入普通話+英文,或者自由語(yǔ)音輸入普通話+6大方言(包括山東話、合肥話、四川話、河南話、西安話、東北話)。從此無(wú)論是“一口地道的倫敦腔”,還是倍感親切的地方口音,都能被百度輸入法快速、準(zhǔn)確地轉(zhuǎn)化成文字,難怪百度輸入法能夠穩(wěn)居語(yǔ)音輸入用戶規(guī)模的第一位。

對(duì)我們用戶而言,語(yǔ)音識(shí)別準(zhǔn)確,自然愛(ài)不釋“嘴”,從艾媒咨詢的統(tǒng)計(jì)數(shù)據(jù)排行來(lái)看,百度輸入法的語(yǔ)音輸入的確“有口皆碑”,準(zhǔn)確度評(píng)分與體驗(yàn)感評(píng)分均遙遙領(lǐng)先于第二、第三位的訊飛與搜狗輸入法。

值得一提的是,百度輸入法目前還有年輕用戶群體喜聞樂(lè)見(jiàn)的語(yǔ)音斗圖、神劇配圖等功能,結(jié)合emoji表情、顏文字、表情包斗圖可以玩出各種花樣。

超級(jí)皮膚、懸浮鍵盤(pán)(僅支持安卓系統(tǒng))、OCR識(shí)別/文字掃描、105種語(yǔ)言支持等等或?qū)嵱谩⒒驑O具個(gè)性的功能,更是讓百度輸入法深受各大用戶群體歡迎。

有了百度輸入法的這些語(yǔ)音輸入秘密武器,雙十一可以閉著眼睛打出剁手清單、跟老鄉(xiāng)口述方言文字聊天,和女友語(yǔ)音斗圖狂撒狗糧——誰(shuí)能想到手機(jī)輸入法也可以如此拉風(fēng)!這大概就是一個(gè)“懂你的輸入法”應(yīng)該有的樣子吧!可以想象,借助諸多AI技術(shù),未來(lái)的百度輸入法將會(huì)更加聰明、便捷,也將更懂你心。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容