前幾天我一個(gè)遠(yuǎn)親老舅來(lái)東北探親,我媽為他接風(fēng)洗塵。他是我姥姥的姐姐的兒子,按輩分叫表舅,我卻從未見(jiàn)過(guò)他。

吃飯時(shí),我對(duì)老舅濃重的四川口音很好奇。后來(lái)才知道,他的爸爸年輕時(shí)就在四川當(dāng)兵,老舅也生在四川,長(zhǎng)在四川,東北話完全不會(huì),普通話也說(shuō)得不太好,所以我們兩家聊天就特別喜感,我還跟老舅學(xué)了好幾句四川話。學(xué)是學(xué)了,標(biāo)不標(biāo)準(zhǔn)就不知道了。

老舅已經(jīng)年過(guò)60,雖然文化也不差,但普通話不標(biāo)準(zhǔn)讓他吃了苦頭。他兒子給他買(mǎi)了新手機(jī),教會(huì)他用微信跟大家聊天,不過(guò)需要打字的時(shí)候就磕磕絆絆,拼音輸入法玩不熟練,敲了老半天出不來(lái)一句話。于是我跟老舅說(shuō),試試百度輸入法的語(yǔ)音輸入,那個(gè)AI,也就是機(jī)器人,會(huì)把你說(shuō)的話,打成文字,一點(diǎn)兒也不用你費(fèi)勁摳鍵盤(pán),老舅一聽(tīng)樂(lè)了:我說(shuō)的四川話你都聽(tīng)不懂,這機(jī)器人能聽(tīng)得懂?

我笑了笑,給他裝好百度輸入法。長(zhǎng)按鍵盤(pán)的空格鍵喚醒“語(yǔ)音輸入”界面,之后點(diǎn)擊“普通話”,在彈出的菜單“語(yǔ)種選擇”里面,切換為“方言自由說(shuō)”,然后把手機(jī)拿給老舅,“您說(shuō)兩句試試”。

老舅咳嗽一聲,看到語(yǔ)音輸入那條聲波動(dòng)了一下,之后,那頗有味道的四川話,就隨著波紋“翻滾”,滔滔不絕起來(lái)。

很快,百度輸入法的光標(biāo)下,一行行準(zhǔn)確的文字就輸出來(lái)了,與老舅說(shuō)的四川話完全一致,可以說(shuō)這“聽(tīng)聲寫(xiě)字”的準(zhǔn)確度和反應(yīng)速度,連我自己都驚掉了下巴?,F(xiàn)在的AI語(yǔ)音識(shí)別,在方言識(shí)別這塊兒都做到這么精準(zhǔn)了?

老舅沒(méi)看我表情,自己很高興,如獲至寶!他說(shuō)以前打字,要么直接微信語(yǔ)音,要么辛苦地按鍵盤(pán),半句話、一句話的往外發(fā)。有這個(gè)方法就太好了,以后跟戰(zhàn)友打字聊天,他肯定發(fā)得最快!
他很快給他兒子發(fā)過(guò)去一連串的話,意思是我大外甥教會(huì)我一種打字方法,我說(shuō)的話全能聽(tīng)懂。他兒子很快回復(fù)他,問(wèn):是什么方法?。?/p>
我說(shuō)是百度輸入法的語(yǔ)音識(shí)別,叫“方言自由說(shuō)”,我按了下語(yǔ)音輸入,這句話也就發(fā)了過(guò)去。他兒子回復(fù)“謝謝我老弟”,我心里也美滋滋。

送走老舅,我擺弄手機(jī),才發(fā)現(xiàn)最新版本的百度輸入法又升級(jí)了,尤其是對(duì)方言輸入這一塊兒,為“方言自由說(shuō)”新增了河北、昆明、武漢三種方言。還將福建、廣東、湖南、江西、四川、吳語(yǔ),這些口音較重的地方口音做了升級(jí),使“方言自由說(shuō)”功能更精準(zhǔn),這樣一來(lái),將會(huì)有更多不太會(huì)說(shuō)普通話的中老年人受益,因?yàn)樗麄円部梢阅弥謾C(jī),通過(guò)百度輸入法痛痛快快的“文字交流”了。
百度輸入法從2019年起,就支持多種方言,你不但可以口述普通話、英語(yǔ)、文言文,就算講粵語(yǔ)、四川話、東北話、河南話、山東話、西安話、合肥話、也可以無(wú)障礙的語(yǔ)音輸入文字。我也很早就體驗(yàn)了東北話轉(zhuǎn)文字,發(fā)現(xiàn)百度輸入法這里面似乎住了個(gè)小電腦,你講得啥他都能聽(tīng)得懂。

事實(shí)上,重口音方言精準(zhǔn)識(shí)別、乃至“方言自由說(shuō)”的功能,都是建立在百度輸入法先進(jìn)的語(yǔ)音技術(shù)之上。早在2019年,百度就已經(jīng)發(fā)布流式截?cái)喽鄬幼⒁饬#⊿MLTA),將在線語(yǔ)音相對(duì)準(zhǔn)確率提升15%,并且離線語(yǔ)音識(shí)別能力同樣強(qiáng)大。

SMLTA技術(shù)也實(shí)現(xiàn)了中文在線語(yǔ)音識(shí)別的兩個(gè)歷史性突破:其一是世界上首次實(shí)現(xiàn)了局部注意力建模識(shí)別精度超過(guò)全局注意力模型,其二是世界上首次大規(guī)模部署在線語(yǔ)音交互注意力模型。簡(jiǎn)單說(shuō)就是百度輸入法通過(guò)SMLTA技術(shù)達(dá)到了國(guó)內(nèi)中文語(yǔ)音識(shí)別的頂峰,百度語(yǔ)音識(shí)別說(shuō)自己是第二,那么就沒(méi)人敢稱(chēng)老大。

在這樣強(qiáng)大的語(yǔ)音識(shí)別能力之下,百度輸入法又著力面向口音豐富、區(qū)別繁雜的中國(guó)地方方言,不斷給百度輸入法賦予更“聰明”的頭腦,讓它能精準(zhǔn)、快速地識(shí)別出不同的中國(guó)地方方言,無(wú)論是你四川人,還是蘇北人,無(wú)論你是不是只會(huì)說(shuō)粵語(yǔ)、只會(huì)說(shuō)福建方言,都可以在百度輸入法的“聆聽(tīng)”之后,快速的轉(zhuǎn)化成你想要寫(xiě)出的文字。這些真人可能聽(tīng)不懂的口音,就這樣被百度輸入法的輕松解析。我聽(tīng)說(shuō),這就是百度輸入法已經(jīng)構(gòu)建成熟的“AI全感官輸入2.0”的冰山一角。

什么是“AI全感官輸入2.0”呢?簡(jiǎn)單講,它就是把之前所說(shuō)的“方言自由說(shuō)”等語(yǔ)音輸入方式,鍵盤(pán)輸入,以及同樣適合老人使用的手寫(xiě)輸入法,更好玩的AR表情輸入、動(dòng)作輸入(一個(gè)非常好玩的凌空手寫(xiě)輸入方法)這些輸入方式的一個(gè)合集?!癆I全感官2.0”意味著百度輸入法不止可以通過(guò)鍵盤(pán)、手寫(xiě)得到你想要輸入的文字,還能將語(yǔ)音、表情、動(dòng)作融為一體,帶來(lái)好玩又便利的文字輸入體驗(yàn)。
寫(xiě)在最后
可以說(shuō),百度輸入法的技術(shù)提升,不止是紙面上的“世界第一”,也是真真切切地造福大眾,惠及民眾。比如讓中老年人更習(xí)慣用手機(jī)交流的語(yǔ)音輸入法、方言自由說(shuō),還有讓老人們手、腦并用的百度手寫(xiě)輸入法。

這些靈活、精準(zhǔn)、快速的文字輸入方式,讓差一點(diǎn)落伍于時(shí)代的老人們有了搭上科技快車(chē)的新機(jī)會(huì),也讓我們看到了老人們臉上自信的笑容。如果你身邊的大爺、大媽也有文字輸入的難處,就把百度輸入法的語(yǔ)音、手寫(xiě)輸入法教給他們吧!