2016年開始,人工智能語言這個賽道上特別擁擠,大公司加上無數(shù)小公司瘋狂涌入,搶占語音入口這個賽道。進入到2018年以來,競爭尤其激烈,這其中,科大訊飛經歷過熱捧以及降溫,也遭受過質疑,兩年過去后,我們再來回望一下如今的語音賽道以及科大訊飛的發(fā)展。
根據騰訊研究院的報告,截止2017年6月,我們將AI各個方面的創(chuàng)業(yè)公司進行了梳理,得到如下圖:

創(chuàng)業(yè)公司的數(shù)量最能說明該領域的熱度,未在表上注明的還有人工智能通用平臺這一大公司的主戰(zhàn)場。從創(chuàng)業(yè)熱門度,融資額度和市場前景來看,根據統(tǒng)計,當前創(chuàng)業(yè)最熱門的幾個領域分別為自然語言處理/語音識別,機器視覺/圖像識別,機器人和自動駕駛/輔助駕駛幾個大的方面。
一、行業(yè)圖譜和公司位置
在大家充分認識到智能語音作為下一個時代交互入口的時候,整個賽道內競爭激烈,各路競爭對手層出不窮??拼笥嶏w作為整個行業(yè)的領導者,已經占據了極端重要的地位,并且在其努力下,正朝著人工智能全平臺+具體行業(yè)應用的模式不斷邁進??傮w我們認為,科大訊飛依托其核心優(yōu)勢,位于人工智能產業(yè)的第一梯隊最弱位置,其對手是阿里巴巴、百度、騰訊及亞馬遜、谷歌等平臺級別的公司,在競爭的多維度能力上,科大訊飛還需要持續(xù)發(fā)展,進行補全。
在自然語言處理和語音識別這個類別上,玩家數(shù)量可以用密密麻麻來形容??梢詣潥w此領域中國創(chuàng)業(yè)公司總計為128家,占整個中國全部人工智能創(chuàng)業(yè)公司592家的22%。這其中,還不包括眾多大公司在秀肌肉。下面是我們根據公開報道情況,整理出來的在自然語言處理和語音識別上的主要玩家和當前著名玩家,制作成簡圖如下:

這些公司主要是我們從公開報道中獲取的信息,創(chuàng)業(yè)公司主要選取里面比較有特色的幾個,不排除有些具有技術壁壘的公司長期蟄伏,一鳴沖天。比如我至今印象深刻的Drive.ai在那個雨夜放出的自動駕駛視頻,直接使這家公司一夜爆紅全球。另外在大公司方面,亞馬遜、google為代表的互聯(lián)網巨頭也可能存在嚴重威脅,畢竟他們在自然語言處理方面能力不容懷疑,當前的關鍵可能是對中文的積累和理解應用不夠深。之所以這個賽道這么擁擠,我想主要是因為以下幾點:
(一)語音作為人工時代的主要入口之一,必須牢牢控制。進入人工智能時代,人機交互方式產生了巨大的革新,語音和圖像交互成為新的交互主要入口,背后代表的是人工智能時代的流量入口和數(shù)據入口,所以這成為了一眾互聯(lián)網大公司和硬件大公司(華為、小米為代表的手機廠商)必須啃下的硬骨頭。
(二)相對于創(chuàng)業(yè)公司最多的計算機視覺與圖像領域,語音交互卻更早迎來了爆發(fā)。因為語音交互要求的帶寬和計算能力更低,對于硬件和基礎設施的要求當前就能滿足,在商業(yè)上更容易實現(xiàn)。圖像所包含的信息量比較大,對圖像進行處理需要更大的計算量和帶寬,這需要硬件計算性能特別突出,還得有5G網絡對大數(shù)據交換和大帶寬進行支持。這就好像AR/MR需要的硬件性能遠遠低于VR,VR遲遲得不到爆發(fā)一樣。這也是為什么相對于智能電視,智能音響這股風潮會首先到來。