App Inventor 語音交互技術(shù)

本文由 WxBit 站長原創(chuàng),轉(zhuǎn)載請注明出處。內(nèi)容僅適用于 App Inventor 2 WxBit?漢化版

WxBit?漢化版在周末悄悄發(fā)布一個里程碑更新,增加了“人工智能”分類,其中的百度語音識別、合成與喚醒,給 App Inventor?應(yīng)用增加了嘴巴和耳朵。有別于“多媒體”分類中的語音合成與識別組件,百度語音交互組件不要求手機安裝第三方語音識別應(yīng)用與合成引擎,通用性更好。本站獨有的語音交互組件,讓我們輕松實現(xiàn)屬于自己的語音助理。

人工智能組件

  在開始介紹語音交互組件前,先要介紹自定義“應(yīng)用包名(Package Name)”,在應(yīng)用首屏(Screen1)的設(shè)計視圖屬性中設(shè)置。這個功能雖然已經(jīng)上線有一段時間,但是應(yīng)該很多同學(xué)沒有注意,也沒有用過。應(yīng)用包名,在 App Inventor 中等同于應(yīng)用ID,是應(yīng)用的唯一標(biāo)識,類似人的身份證號碼。包名中只能包含數(shù)字、字母、點和下劃線,點為分隔符,將包名分割為多個部分,每部分必須以字母開頭。例如:com.wxbit.appinventor.aicompanion3,這是?ai伴侶的包名。_com.abc、com.123、.com.abc,這些都是錯誤格式的包名。

設(shè)置應(yīng)用包名

如果不設(shè)置包名,系統(tǒng)生成APK的包名一般是這樣:wxbit.ai_Q(32位唯一標(biāo)識).項目名稱,例如:wxbit.ai_QCCC18AB0D04C3B7CFD21E1D67A60AF0F.test。如果設(shè)置應(yīng)用包名,系統(tǒng)默認(rèn)會在前面加上“wxbit.”前綴。比如填寫appinventor,則最后生成APK的包名就是:wxbit.appinventor。

如果需要使用離線合成和語音喚醒,正確設(shè)置應(yīng)用包名是必須的步驟。

下面分別介紹百度語音交互3大組件:

一、百度語音識別

使用流式協(xié)議,能夠聽用戶說,即時處理獲得結(jié)果。不需要像Rest API,上傳整個錄音文件才獲得結(jié)果。即時響應(yīng),能夠給用戶更好的使用體驗。

百度語音識別功能概要

  識別模式提供了多種配置,適用于不同的場景。

語音識別的場景模式

詳細說明請參考文檔:http://ai.baidu.com/docs#/ASR-Android-SDK/3557153c

二、百度語音合成

不同于Rest API下載完整個音頻文件再播放,在線模式能夠一邊下載一邊播放。百度語音合成不支持“純離線”模式,首先都會嘗試聯(lián)網(wǎng),如果選擇的不是“純在線模式”,聯(lián)網(wǎng)超時后會使用內(nèi)置的離線引擎合成語音。需要注意的是,第一次使用離線語音合成,一定需要聯(lián)網(wǎng)下載授權(quán)文件。授權(quán)文件與 AppId、AppKey、SecretKey?和應(yīng)用包名相關(guān),詳細配置本文最后再說明。

語音合成功能概要

  純在線模式:也就是不使用離線引擎,生成的APK文件較小,推薦使用。

WiFi在線,6秒超時:連接 WiFi?時使用在線合成,如果 6 秒還未連接成功和連接的不是 WiFi?網(wǎng)絡(luò),則使用離線合成。

WiFi與4G在線,6秒超時:連接 WiFi?和 4G?網(wǎng)絡(luò)時使用在線合成,如果 6 秒還未連接成功或使用的是其他網(wǎng)絡(luò),則使用離線合成。

WiFi與4G在線,1.2秒超時:同上,連接超時時間為1.2秒。

WiFi在線,1.2秒超時:同“WiFi在線,6秒超時”,連接超時時間為1.2秒。

詳細說明請參考文檔:http://ai.baidu.com/docs#/TTS-Android-SDK/47c81acf

三、百度語音喚醒

此喚醒,并非點亮手機屏幕這個“喚醒”。而是應(yīng)用聽到用戶說的特定關(guān)鍵詞,會觸發(fā)事件代碼塊。啟用后臺喚醒后,即使手機是鎖屏狀態(tài),也一樣可以觸發(fā)事件代碼塊。后臺喚醒功能,會加速電量消耗,請謹(jǐn)慎使用。

語音喚醒功能概要

系統(tǒng)內(nèi)置支持10個關(guān)鍵詞,分別是:小寶同學(xué)、拍照、播放、暫停、上一首、下一首、增大音量、減小音量、打開電燈、關(guān)閉電燈。如果需要自定義喚醒詞,請到這里導(dǎo)出:http://ai.baidu.com/tech/speech/wake?。導(dǎo)出的喚醒詞為WakeUp.bin,上傳這個文件到項目的素材中即可。

在設(shè)計視圖或邏輯視圖中啟用語音喚醒功能,當(dāng)用戶說到喚醒詞,“被語音喚醒”事件會被觸發(fā),在這個代碼塊中完成對用戶的回應(yīng)。

因為語音喚醒,是離線識別,必須正確配置?AppId、AppKey、SecretKey?和應(yīng)用包名。如果只是為了測試,可以留空以上三個參數(shù),應(yīng)用包名設(shè)置為:baidu。生成APK的應(yīng)用包名實際是 wxbit.baidu,使用了本文作者配置的百度語音應(yīng)用。

本文由 WxBit 站長原創(chuàng),轉(zhuǎn)載請注明出處。內(nèi)容僅適用于 App Inventor 2 WxBit?漢化版

下文介紹百度語音應(yīng)用的創(chuàng)建,如果你已經(jīng)有百度云服務(wù)帳號,直接進入控制臺創(chuàng)建應(yīng)用。

1、注冊百度云帳號

打開https://cloud.baidu.com,點擊“管理控制臺”,進入登錄界面。如果沒有百度帳號,請先注冊一個,具體步驟這里不做贅述。注冊完百度帳號,回到這里注冊百度云帳號。

百度云注冊

  第一次登錄百度云需要補充些信息,然后進入控制臺。

百度云控制臺

2、創(chuàng)建語音交互應(yīng)用

從控制臺進入“語音識別”創(chuàng)建應(yīng)用,并選擇“Android”,然后填寫ai項目首屏設(shè)置的包名,加上“wxbit.”前綴。比如ai項目應(yīng)用包名設(shè)置的是?com.appinventor.project,在這里應(yīng)該填寫:wxbit.com.appinventor.project 。

在百度云創(chuàng)建語音交互應(yīng)用

3、獲取?AppId、AppKey、SecretKey

查看應(yīng)用詳情

  填寫好應(yīng)用包名與百度語音應(yīng)用的參數(shù),就可以使用百度語音組件啦。

包名及語音參數(shù)設(shè)置


這里有個使用百度語音組件實現(xiàn)的演示應(yīng)用,供大家測試:語音交互功能演示.apk

語音交互功能演示
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 語音方案比對介紹 語音交互是現(xiàn)今應(yīng)用最多的智能交互方式,在人工智能越來越火的當(dāng)下應(yīng)用十分廣泛,所以特別針對車內(nèi)環(huán)境...
    莫君陌閱讀 3,836評論 0 6
  • 1調(diào)研背景 2014年11月發(fā)布亞馬遜低調(diào)發(fā)布智能音箱Echo,內(nèi)測半年后于2015年正式發(fā)售,當(dāng)年銷量為250萬...
    殷大俠閱讀 2,685評論 0 8
  • 暑假,在福建的一個小鎮(zhèn)上,陪姐姐和外甥度過了一段快樂的時光,現(xiàn)在坐在回去的車上,憑著記憶記錄下這些趣事。 也許,這...
    阿銀老師閱讀 545評論 12 8
  • 11月12日凌晨,我的外婆走了,那個管我叫“阿弟”的人走了。從今以后,當(dāng)我再叫“外婆”的時候,再也不會有人笑著、大...
    葉落階前閱讀 1,327評論 0 2
  • 風(fēng)吹秋涼 我站在陌生的城市的窗旁 風(fēng)就這樣吹了進來 我向南方眺望 樹在搖擺、沙沙的響 一片、兩片、三片、的樹葉 被...
    湯唯民閱讀 425評論 0 2

友情鏈接更多精彩內(nèi)容