原文: https://wit.ai/blog/2014/02/12/speech-api
語(yǔ)音控制是未來(lái)??苹眯≌f(shuō)在幾十年前就有這些情節(jié)了,但是我們現(xiàn)在還必須要移動(dòng)一段距離去開電視或者設(shè)置一個(gè)鬧鐘。我們的任務(wù)就是去改變這個(gè)現(xiàn)狀。給應(yīng)用或者設(shè)備加上語(yǔ)音接口應(yīng)該是一件容易的事情。
把說(shuō)話轉(zhuǎn)化成可以操作的數(shù)據(jù)
今天,我們非常興奮得發(fā)布我們的新接口“說(shuō)話轉(zhuǎn)化成JSON”, 在“文本轉(zhuǎn)化成JSON”接口運(yùn)行四個(gè)月之后。
![]{https://d2n5jyo54r6d2a.cloudfront.net/blog/images/speech/speech2json.png}
從現(xiàn)在開始,您的應(yīng)用,設(shè)備或者您的網(wǎng)站都可以發(fā)送音頻流到我們的服務(wù)器,在返回值中拿到可以操作的數(shù)據(jù)。
我們來(lái)看一下它在智能家庭場(chǎng)景下的應(yīng)用:
http://youtu.be/HXLmhyWkvFM
它是如何實(shí)現(xiàn)的?
在屏幕后面,Wit整合了多種最先進(jìn)的自然語(yǔ)言處理技術(shù)和多種說(shuō)話識(shí)別引擎以達(dá)到即使在充滿噪音的環(huán)境或者語(yǔ)言有多種變化的情景下的低延遲性和高健壯性(對(duì)同一件事可以有一百種說(shuō)法)。
值得高興的是,您不需要關(guān)心所有這些細(xì)節(jié)。我們致力于創(chuàng)造極致簡(jiǎn)單的開發(fā)者體驗(yàn)。您只需要花費(fèi)幾分鐘在我們的網(wǎng)站上就能啟動(dòng)起來(lái)。Wit可以適配您的所有領(lǐng)域,從冰淇淋分發(fā)到空間問(wèn)題,我們不做任何的假設(shè),保證100%的可配置。
您需要花費(fèi)5分鐘去構(gòu)建屬于自己的配置
http://youtu.be/CLVysc62w_A
使用API
接下來(lái),調(diào)用API也是很簡(jiǎn)單的。我們提供了多種客戶端的SDK完成音頻記錄和發(fā)送,在IOS和Android,甚至單個(gè)網(wǎng)頁(yè)上。你也可以使用HTTP接口實(shí)時(shí)得錄音和上傳音頻文件。
讓我們來(lái)處理這段聲音(錄制在一處山谷中的慶典上,能聽出來(lái)是誰(shuí)嗎?)
通過(guò)POST請(qǐng)求提交到 Wit API
curl -XPOST 'https://api.wit.ai/speech'
-i -L
-H "Authorization: Bearer $TOKEN"
-H "Content-Type: audio/wav"
--data-binary "@sample.wav"
您會(huì)得到這個(gè)返回值
{
"msg_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}
想構(gòu)建您自己的語(yǔ)音接口?來(lái)這里注冊(cè)吧!
https://wit.ai/
Wit 團(tuán)隊(duì)