人工智障 2:你所看到的AI和智能無(wú)關(guān)(上)

“?Artificial-Intelligently Challenged?”

前言

大家好,我又出來(lái)懟人了。

兩年前,寫了一篇文章《為什么現(xiàn)在的人工智能助理都像人工智障》,當(dāng)時(shí)主要是懟“智能助理們”。這次呢則是表達(dá)?“我不是針對(duì)誰(shuí),只是現(xiàn)在所有的深度學(xué)習(xí)都搞不定對(duì)話AI”,以及“你看都這樣了,那該怎么做AI產(chǎn)品”。


閱讀門檻?

時(shí)間:這篇真的太長(zhǎng)了(近3萬(wàn)字)根據(jù)預(yù)覽同學(xué)們的反饋,通常第一次閱讀到Part 3時(shí),會(huì)消耗很多精力,但讀完P(guān)art 3才發(fā)現(xiàn)是精華(同時(shí)也是最燒腦的部分)。請(qǐng)大家酌情安排閱讀時(shí)間。

可讀性:我會(huì)在內(nèi)容里邀請(qǐng)你一起思考(無(wú)需專業(yè)知識(shí)),所以可能不適合通勤時(shí)間閱讀。你的閱讀收益取決于在過(guò)程中思考的參與程度。

適合人群:對(duì)話智能行業(yè)從業(yè)者、AIPM、關(guān)注AI的投資人、對(duì)AI有強(qiáng)烈興趣的朋友、關(guān)心自己的工作會(huì)不會(huì)被AI代替的朋友;

關(guān)于鏈接:閱讀本文時(shí),無(wú)需閱讀每個(gè)鏈接里的內(nèi)容,這并不會(huì)影響對(duì)本文的理解。


關(guān)于人工智障四個(gè)字

上一片文章發(fā)出后,有朋友跟我說(shuō),標(biāo)題里的“人工智障”這個(gè)詞貌似有點(diǎn)offensive。作為學(xué)語(yǔ)言出身的,我來(lái)解釋一下這個(gè)原因:

最開始呢,我是在跟一位企業(yè)咨詢顧問(wèn)聊人工智能這個(gè)賽道的現(xiàn)狀。因?yàn)閷?duì)話是用英語(yǔ)展開的,當(dāng)時(shí)為了表達(dá)我的看法? “現(xiàn)在的智能助理行業(yè)正處在一種難以逾越的困境當(dāng)中”,我就跟她說(shuō)“Currently all the digital assistants are Artificial-Intelligently challenged”。

她聽了之后哈哈一笑?!癷ntelligently challenged”同時(shí)也是英文中對(duì)智障的委婉表達(dá)。 假設(shè)不了解這個(gè)常識(shí),她就可能忽略掉這個(gè)梗,盡管能明白核心意思,只是不會(huì)覺(jué)得有什么好笑的。那么信息在傳遞中就有損失。

寫文章時(shí),我把這個(gè)信息翻譯成中文,就成了“人工智障”。但是因?yàn)橹形恼Z(yǔ)法的特性,有些信息就lost in translation了。比如實(shí)際表達(dá)的是“一種困境的狀態(tài)”而不是“一件事”。

(順便說(shuō)一下,中文的智障,實(shí)際上是政治正確的稱呼,詳見特殊奧運(yùn)會(huì)的用詞方法。)

為什么要寫那么多字來(lái)解釋這個(gè)措辭?因?yàn)?b>不同的人,看見相同的字,也會(huì)得到不同的理解。這也是我們要討論的重點(diǎn)之一。

那么,我們開始吧。


Part 1?

對(duì)話智能的表現(xiàn):智障

Sophia in?AI for Good Global Summit 2017.Source:??ITU

2017年10月,上圖這個(gè)叫Sophia的機(jī)器人,被沙特阿拉伯授予了正式的公民身份。公民身份,這個(gè)評(píng)價(jià)比圖靈測(cè)試還要牛。何況還是在沙特,他們才剛剛允許女性開車不久(2017年9月頒布的法令)。

Sophia經(jīng)常參加各種會(huì)、“發(fā)表演講”、“接受采訪”,比如去聯(lián)合國(guó)對(duì)話,表現(xiàn)出來(lái)非常類似人類的言談;去和Will Smith拍MV;接受Good morning Britain之類的主流媒體的采訪;甚至公司創(chuàng)始人參加Jim Fallon的訪談時(shí)一本正經(jīng)的說(shuō)Sophia是“basically alive”。


Basically alive. 要知道,西方的吃瓜群眾都是看著《終結(jié)者》長(zhǎng)大的,前段時(shí)間還看了《西部世界》。在他們的世界模型里,“機(jī)器智能會(huì)覺(jué)醒” 這個(gè)設(shè)定是遲早都會(huì)發(fā)生的。

普通大眾開始嚇得瑟瑟發(fā)抖。不僅開始擔(dān)心自己的工作是不是會(huì)被替代,還有很多人開始擔(dān)心AI會(huì)不會(huì)統(tǒng)治人類,這樣的話題展開?!拔磥?lái)已來(lái)”,很多人都以為真正的人工智能已經(jīng)近在咫尺了。

只是,有些人可能會(huì)注意到有些不合理的地方:“等等,人工智能都要威脅人類了,為啥我的Siri還那么蠢?”


Source:?Dumb And Dumber: Comparing Alexa, Siri, Cortana And The Google Assistant, Forbes, May 2018

我們來(lái)看看到2018年末在對(duì)話智能領(lǐng)域,各方面究竟發(fā)展的如何了。


?“?不要日本菜?

我在2016年底做過(guò)一個(gè)測(cè)試,對(duì)幾個(gè)智能助理提一個(gè)看似簡(jiǎn)單的需求:“推薦餐廳,不要日本菜”。只是各家的AI助理都會(huì)給出一堆餐廳推薦,全是日本菜。

2年過(guò)去了,在這個(gè)問(wèn)題的處理上有進(jìn)展么?我們又做了一次測(cè)試:?

結(jié)果是依然沒(méi)有解決?!安灰眱蓚€(gè)字被所有助理一致忽略了。

為什么要關(guān)注“不要”兩個(gè)字?之前我去到一家某非常有名的智能語(yǔ)音創(chuàng)業(yè)公司,聊到這個(gè)問(wèn)題時(shí),他家的PM顯出疑惑:“這個(gè)邏輯處理有什么用?我們后臺(tái)上看到用戶很少提出這類表達(dá)啊?!?/p>

聽到這樣的評(píng)論,基本可以確定:這家公司還沒(méi)有深入到專業(yè)服務(wù)對(duì)話領(lǐng)域。

場(chǎng)景方面,一旦深入進(jìn)服務(wù)領(lǐng)域里的多輪對(duì)話,很容易會(huì)遇到類似這樣的表達(dá) :“我不要這個(gè),有更便宜的么?”。后臺(tái)沒(méi)有遇到,只能說(shuō)用戶還沒(méi)開始服務(wù)就結(jié)束了。場(chǎng)景方面與AI公司的domain選擇有關(guān)。

但是在技術(shù)方面,則是非常重要的。因?yàn)檫@正是真正智能的核心特點(diǎn)。我們將在part 2&3詳細(xì)聊聊這個(gè)問(wèn)題?,F(xiàn)在先拋個(gè)結(jié)論:這個(gè)問(wèn)題解決不了,智能助理會(huì)一直智障下去的。


“??To C 團(tuán)隊(duì)轉(zhuǎn) To B

自從2015年幾個(gè)重要的深度學(xué)習(xí)在開發(fā)者當(dāng)中火了起來(lái),大小公司都想做“Her”這樣面對(duì)個(gè)人消費(fèi)者的通用型智能助理(To C類產(chǎn)品的終極目標(biāo))。一波熱錢投給最有希望的種子隊(duì)伍(擁有Fancy背景)之后,全滅。目前為止,在2C這方面的所有商用產(chǎn)品,無(wú)論是巨頭還是創(chuàng)業(yè)公司,全部達(dá)不到用戶預(yù)期。

在人們的直覺(jué)里,會(huì)認(rèn)為“智能助理”,處理的是一些日常任務(wù),不涉及專業(yè)的需求,應(yīng)該比“智能專家”好做。這是延續(xù)“人”的思路。推薦餐廳、安排行程是人人都會(huì)做的事情;卻只有少數(shù)受過(guò)專業(yè)訓(xùn)練的人能夠處理金融、醫(yī)療問(wèn)診這類專業(yè)問(wèn)題。

而對(duì)于現(xiàn)在的AI,情況正好相反?,F(xiàn)在能造出在圍棋上打敗柯潔的AI,但是卻造不出來(lái)能給柯潔管理日常生活的AI。

隨著to C助理賽道的崩盤,To B or not to B已經(jīng)不再是問(wèn)題,因?yàn)橐呀?jīng)沒(méi)得選了,只能To B。這不是商業(yè)模式上的選擇,而是技術(shù)的限制。目前To B,特別是限定領(lǐng)域的產(chǎn)品,相對(duì)To C類產(chǎn)品更可行:一個(gè)原因是領(lǐng)域比較封閉,用戶從思想到語(yǔ)言,不容易發(fā)揮跑題;另一方面則是數(shù)據(jù)充分。

只是To B的公司都很容易被當(dāng)成是做“外包”的。因?yàn)榭蛻羰且粋€(gè)個(gè)談下來(lái)的,項(xiàng)目是一個(gè)個(gè)交付的,這意味著增長(zhǎng)慢,靠人堆,沒(méi)有復(fù)利帶來(lái)的指數(shù)級(jí)增長(zhǎng)。大家紛紛表示不開心。

這個(gè)“幫人造機(jī)器人”的業(yè)務(wù)有點(diǎn)像“在網(wǎng)頁(yè)時(shí)代幫人建站”。轉(zhuǎn)成To B的團(tuán)隊(duì)經(jīng)常受到資本的質(zhì)疑: “你這個(gè)屬于做項(xiàng)目,怎么規(guī)?;??”

要知道,國(guó)內(nèi)的很多投資機(jī)構(gòu)和里面的投資經(jīng)理入行的時(shí)間,是在國(guó)內(nèi)的移動(dòng)互聯(lián)起來(lái)的那一波?!癝calability”或者“高速增長(zhǎng)”是體系里最重要的指標(biāo),沒(méi)有之一。而做項(xiàng)目這件事,就是Case by case,要增長(zhǎng)就要堆人,也就很難出現(xiàn)指數(shù)級(jí)增長(zhǎng)。這就有點(diǎn)尷尬了。

“你放心,我有SaaS!哦不,是AIaaS。我可以打造一個(gè)平臺(tái),上面有一系列工具,可以讓客戶們自己組裝機(jī)器人?!?

然而,這些想做技能平臺(tái)的創(chuàng)業(yè)公司,也沒(méi)有一個(gè)成功的。短期也不可能成功。


Yann LeCun對(duì)AIaas的看法

主要的邏輯是這樣的:你給客戶提供工具,但他需要的是雕像——這中間還差了一個(gè)雕塑家。佐證就是那些各家試圖開放“對(duì)話框架”給更小的開發(fā)者,甚至是服務(wù)提供者,幫助他們“3分鐘開發(fā)出自己的AI機(jī)器人”,具體就不點(diǎn)名了。自己都開發(fā)不出來(lái)一個(gè)讓人滿意的產(chǎn)品,還想抽象一個(gè)范式出來(lái)讓別人沿用你的(不work的)框架?

不過(guò),我認(rèn)為MLaaS在長(zhǎng)期的成功是有可能的,但還需要行業(yè)發(fā)展更為成熟的時(shí)候,現(xiàn)在為時(shí)尚早。具體分析我們?cè)诤竺鍼art 5會(huì)談到。


“?音箱的成功和智能的失敗 ”

對(duì)話這個(gè)領(lǐng)域,另一個(gè)比較火的賽道是智能音箱。

各大主要科技公司都出了自己的智能音箱,騰訊叮當(dāng)、阿里的天貓精靈、小米音箱、國(guó)外的Alexa、Google的音箱等等。作為一個(gè)硬件品類,這其實(shí)是個(gè)還不錯(cuò)的生意,基本屬于制造業(yè)。

不僅出貨不差,還被寄予期望,能夠成為一個(gè)生態(tài)的生意——核心邏輯看上去也是充滿想象力的:

超級(jí)終端:在后移動(dòng)時(shí)代,每家都想像iphone一樣搶用戶的入口。只要用戶習(xí)慣使用語(yǔ)音來(lái)獲得咨詢或者服務(wù),甚至可以像Xbox/ps一樣,硬件賠錢賣,軟件來(lái)掙錢;

用語(yǔ)音做OS:開發(fā)者打造各類語(yǔ)音的技能,然后通過(guò)大量“離不開的技能” 反哺這個(gè)OS的市場(chǎng)占有;

提供開發(fā)者平臺(tái):像Xcode一樣,給開發(fā)者提供應(yīng)用開發(fā)的工具和分發(fā)平臺(tái)、提供使用服務(wù)的流量。

可是,這些技能使用的實(shí)際情況是這樣的:?

Source:?Statista

萬(wàn)眾期待的killer app并沒(méi)有出現(xiàn);

基本沒(méi)有商業(yè)服務(wù)型的應(yīng)用;

技能開發(fā)者都沒(méi)賺到錢,也不知道怎么賺錢;

大部分高頻使用的技能都沒(méi)有商業(yè)價(jià)值——用戶用的最多的就是“查天氣”

沒(méi)有差異性:智能的差異嘛基本都沒(méi)有的事兒。


?皇帝的新人工智能?

回過(guò)頭來(lái),我們?cè)賮?lái)看剛剛那位沙特阿拉伯的公民,Sophia。既然剛剛提到的那么多公司投入了那么多錢和科學(xué)家,都搞成這樣,憑什么這個(gè)Sophia能一鳴驚人?

因?yàn)镾ophia的“智能” 是個(gè)騙局。

可以直接引用Yann LeCun對(duì)此的評(píng)價(jià), “這完全是鬼扯”。?

簡(jiǎn)單來(lái)說(shuō),Sophia是一個(gè)帶喇叭的木偶——在各種大會(huì)上的發(fā)言和采訪的內(nèi)容都是人工撰寫,然后用人人都有的語(yǔ)音合成做輸出。卻被宣傳成為是其“人工智能”的自主意識(shí)言論。

這還能拿“公民身份”,可能是人類公民被黑的最慘的一次。這感覺(jué),好像是我家的橘貓被一所985大學(xué)授予了土木工程學(xué)士學(xué)位。

其實(shí)對(duì)話系統(tǒng)里,用人工來(lái)撰寫內(nèi)容,或者使用模版回復(fù),這本來(lái)就是現(xiàn)在技術(shù)的現(xiàn)狀(在后面我們會(huì)展開)。

但刻意把“非智能”的產(chǎn)物說(shuō)成是“智能”的表現(xiàn),這就不對(duì)了。

考慮到大部分吃瓜群眾是通過(guò)媒體渠道來(lái)了解當(dāng)前技術(shù)發(fā)展的,跟著炒作的媒體(比如被點(diǎn)名的Tech Insider)都是這場(chǎng)騙局的共犯。這些不知道是無(wú)知還是無(wú)良的文科生,真的沒(méi)有做好新聞工作者份內(nèi)的調(diào)查工作。

最近這股妖風(fēng)也吹到了國(guó)內(nèi)的韭菜園里。?

Sophia出現(xiàn)在了王力宏的一首講AI的MV里;然后又2018年11月跑去給大企業(yè)站臺(tái)。

真的,行業(yè)內(nèi)認(rèn)真做事兒的小伙伴,都應(yīng)該站出來(lái),讓大家更清晰的知道現(xiàn)在AI——或者說(shuō)機(jī)器學(xué)習(xí)的邊界在哪兒。不然甲方爸爸們信以為真了,突然指著sophia跟你說(shuō),“ 別人都能這么自然,你也給我整一個(gè)?!?/p>

你怕不得裝個(gè)真人進(jìn)去?

對(duì)了,說(shuō)到這兒,確實(shí)現(xiàn)在也有:用人——來(lái)偽裝成人工智能——來(lái)模擬人,為用戶服務(wù)。

Source:?The?Guardian

國(guó)內(nèi)的案例典型的就是銀行用的大堂機(jī)器人,其實(shí)是真人在遠(yuǎn)程語(yǔ)音(所謂Tele presence)。美國(guó)有X.ai,做基于Email的日程管理的。只是這個(gè)AI到了下午5點(diǎn)就要下班。

當(dāng)然,假如我是這些騙局背后開發(fā)者,被質(zhì)疑的時(shí)候,我還可以強(qiáng)行拉回人工智能上:“這么做是為了積累真正的對(duì)話數(shù)據(jù),以后用來(lái)做真的AI對(duì)話系統(tǒng)識(shí)別的訓(xùn)練。”

這么說(shuō)對(duì)外行可能是毫無(wú)破綻的。但是真正行業(yè)內(nèi)干正經(jīng)事的人,都應(yīng)該像傅盛那樣站出來(lái),指明這些做法是騙人:“全世界沒(méi)有一家能做出來(lái)......做不到,一定做不到”。

人家沙特是把AI當(dāng)成人,這些套路是把人當(dāng)成AI。然后大眾就開始分不清楚究竟什么是AI了。


?人工智能究竟(tmd)指的是什么?

另一方面,既然AI現(xiàn)在的那么蠢,為什么馬一龍 (Elon Musk) 卻說(shuō)“AI很有可能毀滅人類”;霍金甚至直接說(shuō)?“AI可能是人類文明里最糟糕的事件”。

而在另一邊,F(xiàn)acebook和Google的首席科學(xué)家卻在說(shuō),現(xiàn)在的AI都是渣渣,根本不需要擔(dān)心,甚至應(yīng)該推翻重做。

大家該相信誰(shuí)的?一邊是要去火星的男人,和說(shuō)不定已經(jīng)去了火星的男人;另一邊是當(dāng)前兩家科技巨頭的領(lǐng)軍人物。

其實(shí)他們說(shuō)的都對(duì),因?yàn)檫@里說(shuō)到的“人工智能”是兩碼事。

馬一龍和霍金擔(dān)心的人工智能,是由人造出來(lái)的真正的智能,即通用人工智能(AGI, Artificial General Intelligence)甚至是超級(jí)智能(Super Intelligence)。

而Yann LeCun 和Hinton指的人工智能則是指的當(dāng)前用來(lái)實(shí)現(xiàn)“人工智能效果”的技術(shù)(基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí))。這兩位的觀點(diǎn)是“用這種方式來(lái)實(shí)現(xiàn)人工智能是行不通的”。

兩者本質(zhì)是完全不同的,一個(gè)指的是結(jié)果,一個(gè)指的是(現(xiàn)在的)過(guò)程。

那么當(dāng)我們?cè)谟懻撊斯ぶ悄艿臅r(shí)候,究竟在說(shuō)什么?

John McCathy


John McCathy在1956年和Marvin Minsky,Nathaniel Rochester 以及Claude Shannon在達(dá)特貌似研討會(huì)上打造了AI這個(gè)詞,但是到目前為止,學(xué)界工業(yè)界并沒(méi)有一個(gè)統(tǒng)一的理解。

最根本的問(wèn)題是目前人類對(duì)“智能”的定義還不夠清楚。何況人類本身是否是智能的最佳體現(xiàn),還不一定呢。想想每天打交道的一些人:)

一方面,在大眾眼中,人工智能是 “人造出來(lái)的,像人的智能”,比如Siri。同時(shí),一個(gè)AI的水平高低,則取決于它有多像人。所以當(dāng)Sophia出現(xiàn)在公眾眼中的時(shí)候,普通人會(huì)很容易被蒙蔽(甚至能通過(guò)圖靈測(cè)試)。?

Oracle對(duì)AI的定義也是 “只要是能讓計(jì)算機(jī)可以模擬人類行為的技術(shù),都算!”

而另一方面,從字面上來(lái)看“Artificial Intelligence”,只要是人造的智能產(chǎn)品,理論上都算作人工智能。?

也就是說(shuō),一個(gè)手持計(jì)算器,盡管不像人,也應(yīng)算是人工智能產(chǎn)品。但我相信大多數(shù)人都不會(huì)把計(jì)算器當(dāng)成是他們所理解的人工智能。

這些在認(rèn)識(shí)上不同的解讀,導(dǎo)致當(dāng)前大家對(duì)AI應(yīng)用的期望和評(píng)估都有很多差異。

再加上還有“深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)” 這些概念紛紛跟著人工智能一起出現(xiàn)。但是各自意味著什么,之間是什么關(guān)系,普通大眾都不甚了解。

“ 沒(méi)關(guān)系,韭菜不用懂?!?但是想要割韭菜的人,最好能搞清楚吧。連有些投資人自己也分不清,你說(shuō)怎么做判斷,如何投項(xiàng)目?當(dāng)然是投胸大的。

以上,就是到2018年末,在對(duì)話領(lǐng)域的人工智能的現(xiàn)狀:智能助理依然智障;大部分To B的給人造機(jī)器人的都無(wú)法規(guī)?;?;對(duì)話方面沒(méi)有像AlphaZero在圍棋領(lǐng)域那樣的讓人震驚的產(chǎn)品;沒(méi)有商業(yè)上大規(guī)模崛起的跡象;有的是一團(tuán)渾水,和渾水摸魚的人。

為什么會(huì)這樣?為什么人工智能在圖像識(shí)別,人臉識(shí)別,下圍棋這些方面都那么快的進(jìn)展,而在對(duì)話智能這個(gè)領(lǐng)域卻是如此混亂?

既然你都看到這里了,我相信你是一個(gè)愿意探究本質(zhì)的好同志。那么我們來(lái)了解,對(duì)話的本質(zhì)是什么;以及現(xiàn)在的對(duì)話系統(tǒng)的本質(zhì)又是什么。


Part 2

當(dāng)前對(duì)話系統(tǒng)的本質(zhì):填表


?AI thinks, man laughs?

Source:The Globe and Mail

有一群小雞出生在一個(gè)農(nóng)場(chǎng),無(wú)憂無(wú)慮安心地生活。

雞群中出現(xiàn)了一位科學(xué)家,它注意到了一個(gè)現(xiàn)象:每天早上,食槽里會(huì)自動(dòng)出現(xiàn)糧食。

作為一名優(yōu)秀的歸納法信徒(Inductivist),這只科學(xué)雞并不急于給出結(jié)論。它開始全面觀察并做好記錄,試圖發(fā)現(xiàn)這個(gè)現(xiàn)象是否在不同的條件下都成立。

“星期一是這樣,星期二是這樣;樹葉變綠時(shí)是這樣,樹葉變黃也是這樣;天氣冷是這樣,天氣熱也是這樣;下雨是這樣,出太陽(yáng)也是這樣!”?

每天的觀察,讓它越來(lái)越興奮,在心中,它離真相越來(lái)越接近。直到有一天,這只科學(xué)雞再也沒(méi)有觀察到新的環(huán)境變化,而到了當(dāng)天早上,雞舍的門一打開,它跑到食槽那里一看,依然有吃的!

科學(xué)雞,對(duì)他的小伙伴,志在必得地宣布:“我預(yù)測(cè),每天早上,槽里會(huì)自動(dòng)出現(xiàn)食物。明天早上也會(huì)有!以后都會(huì)有!我們不用擔(dān)心餓死了!”

經(jīng)過(guò)好幾天,小伙伴們都驗(yàn)證了這個(gè)預(yù)言,科學(xué)雞驕傲的并興奮的把它歸納成“早起的小雞有食吃定理”。

正好,農(nóng)場(chǎng)的農(nóng)夫路過(guò),看到一只興奮的雞不停的咯咯叫,他笑了:“這只雞很可愛(ài)哦,不如把它做成叫花雞好了” 。

科學(xué)雞,卒于午飯時(shí)間。

在這個(gè)例子里,這只羅素雞(Bertrand Russell’s chicken)只對(duì)現(xiàn)象進(jìn)行統(tǒng)計(jì)和歸納,不對(duì)原因進(jìn)行推理。

而主流的基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí),也是通過(guò)大量的案例,靠對(duì)文本的特征進(jìn)行歸類,來(lái)實(shí)現(xiàn)對(duì)識(shí)別語(yǔ)義的效果。這個(gè)做法,就是羅素雞。

目前,這是對(duì)話式人工智能的主流技術(shù)基礎(chǔ)。其主要應(yīng)用方向,就是對(duì)話系統(tǒng),或稱為Agent。之前提到的智能助理Siri,Cortana,Google Assistant以及行業(yè)里面的智能客服這些都算是對(duì)話智能的應(yīng)用。


?對(duì)話智能的黑箱?

這些產(chǎn)品的交互方式,是人類的自然語(yǔ)言,而不是圖像化界面。

圖形化界面(GUI)的產(chǎn)品,比如網(wǎng)頁(yè)或者APP的產(chǎn)品設(shè)計(jì),是所見即所得、界面即功能。

對(duì)話智能的交互(CUI, Conversational UI)是個(gè)黑箱:終端用戶能感知到自己說(shuō)出的話(輸入)和機(jī)器人的回答(輸出)——但是這個(gè)處理的過(guò)程是感覺(jué)不到的。就好像跟人說(shuō)話,你并不知道他是怎么想的。

每一個(gè)對(duì)話系統(tǒng)的黑箱里,都是開發(fā)者自由發(fā)揮的天地。

雖說(shuō)每家的黑箱里面都不同,但是最底層的思路,都萬(wàn)變不離其宗,核心就是兩點(diǎn):聽人話(識(shí)別)+?講人話(對(duì)話管理)。

如果你是從業(yè)人員,那么請(qǐng)回答一個(gè)問(wèn)題:你們家的對(duì)話管理是不是填槽?若是,你可以跳過(guò)這一節(jié)(主要科普填槽是怎么回事),請(qǐng)直接到本章的第五節(jié)“當(dāng)前對(duì)話系統(tǒng)的局限” 。


?AI如何聽懂人話 ?

對(duì)話系統(tǒng)這個(gè)事情在2015年開始突然火起來(lái)了,主要是因?yàn)橐粋€(gè)技術(shù)的普及:機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)帶來(lái)的語(yǔ)音識(shí)別和NLU(自然語(yǔ)言理解)——主要解決的是識(shí)別人講的話。

這個(gè)技術(shù)的普及讓很多團(tuán)隊(duì)都掌握了一組關(guān)鍵技能:意圖識(shí)別和實(shí)體提取。這意味著什么?我們來(lái)看一個(gè)例子。

在生活中,如果想要訂機(jī)票,人們會(huì)有很多種自然的表達(dá):

“訂機(jī)票”;

“有去上海的航班么?”;

“看看航班,下周二出發(fā)去紐約的”;

“要出差,幫我查下機(jī)票”;

等等等等

可以說(shuō)“自然的表達(dá)” 有無(wú)窮多的組合(自然語(yǔ)言)都是在代表 “訂機(jī)票” 這個(gè)意圖的。而聽到這些表達(dá)的人,可以準(zhǔn)確理解這些表達(dá)指的是“訂機(jī)票”這件事。

而要理解這么多種不同的表達(dá),對(duì)機(jī)器是個(gè)挑戰(zhàn)。在過(guò)去,機(jī)器只能處理“結(jié)構(gòu)化的數(shù)據(jù)”(比如關(guān)鍵詞),也就是說(shuō)如果要聽懂人在講什么,必須要用戶輸入精確的指令。

所以,無(wú)論你說(shuō)“我要出差”還是“幫我看看去北京的航班”,只要這些字里面沒(méi)有包含提前設(shè)定好的關(guān)鍵詞“訂機(jī)票”,系統(tǒng)都無(wú)法處理。而且,只要出現(xiàn)了關(guān)鍵詞,比如“我要退訂機(jī)票”里也有這三個(gè)字,也會(huì)被處理成用戶想要訂機(jī)票。

自然語(yǔ)言理解這個(gè)技能出現(xiàn)后,可以讓機(jī)器從各種自然語(yǔ)言的表達(dá)中,區(qū)分出來(lái),哪些話歸屬于這個(gè)意圖;而那些表達(dá)不是歸于這一類的,而不再依賴那么死板的關(guān)鍵詞。比如經(jīng)過(guò)訓(xùn)練后,機(jī)器能夠識(shí)別“幫我推薦一家附近的餐廳”,就不屬于“訂機(jī)票”這個(gè)意圖的表達(dá)。

并且,通過(guò)訓(xùn)練,機(jī)器還能夠在句子當(dāng)中自動(dòng)提取出來(lái)“上海”,這兩個(gè)字指的是目的地這個(gè)概念(即實(shí)體);“下周二”指的是出發(fā)時(shí)間。

這樣一來(lái),看上去“機(jī)器就能聽懂人話啦!”。

這個(gè)技術(shù)為啥會(huì)普及?主要是因?yàn)闄C(jī)器學(xué)習(xí)領(lǐng)域的學(xué)術(shù)氛圍,導(dǎo)致重要的論文基本都是公開的。不同團(tuán)隊(duì)要做的是考慮具體工程實(shí)施的成本。

最后的效果,就是在識(shí)別自然語(yǔ)言這個(gè)領(lǐng)域里,每家的基礎(chǔ)工具都差不多。在意圖識(shí)別和實(shí)體提取的準(zhǔn)確率,都是百分點(diǎn)的差異。既然這個(gè)工具本身不是核心競(jìng)爭(zhēng)力,甚至你可以用別家的,大把可以選,但是關(guān)鍵是你能用它來(lái)干什么?

“Due to the academic culture that ML comes from, pretty much all of the primary science is published as soon as it’s created - almost everything new is a paper that you can read and build with. But what do you build? ”——Benedict Evans (A16Z合伙人)

在這方面,最顯而易見的價(jià)值,就是解放雙手。語(yǔ)音控制類的產(chǎn)品,只需要聽懂用戶的自然語(yǔ)言,就去執(zhí)行這個(gè)操作:在家里要開燈,可以直接說(shuō) “開燈”,而不用去按開關(guān);在車上,說(shuō)要“開天窗”,天窗就打開了,而不用去找對(duì)應(yīng)的按鈕在哪里。

這類系統(tǒng)的重點(diǎn)在于,清楚聽清哪個(gè)用戶在講是什么。所以麥克風(fēng)陣列、近場(chǎng)遠(yuǎn)場(chǎng)的抗噪、聲紋識(shí)別講話的人的身份、ASR(語(yǔ)音轉(zhuǎn)文字),等等硬件軟件的技術(shù)就相應(yīng)出現(xiàn),向著前面這個(gè)目標(biāo)不斷優(yōu)化。

“講人話”在這類應(yīng)用當(dāng)中,并不那么重要。通常任務(wù)的執(zhí)行,以結(jié)果進(jìn)行反饋,比如燈應(yīng)聲就亮了。而語(yǔ)言上的反饋,只是一個(gè)輔助作用,可有可無(wú)。

但是任務(wù)類的對(duì)話智能,往往不止是語(yǔ)音控制這樣一輪交互。如果一個(gè)用戶說(shuō),“看看明天的機(jī)票”——這表達(dá)正常,但無(wú)法直接去執(zhí)行。因?yàn)槿鄙賵?zhí)行的必要信息:1)從哪里出發(fā)?和 2)去哪里?

如果我們希望AI Agent來(lái)執(zhí)行這個(gè)任務(wù),一定要獲得這兩個(gè)信息。對(duì)于人來(lái)完成這個(gè)業(yè)務(wù)的話,要獲得信息,就得靠問(wèn)這個(gè)用戶問(wèn)題,來(lái)獲得信息。很多時(shí)候,這樣的問(wèn)題,還不止一個(gè),也就意味著,要發(fā)起多輪對(duì)話。

對(duì)于AI而言,也是一樣的。

要知道 “去哪里” = Agent 問(wèn)用戶“你要去哪里?”

要知道 “從哪里出發(fā)” = Agent 問(wèn)用戶“你要從哪里出發(fā)呢?”

這就涉及到了對(duì)話語(yǔ)言的生成。


?AI?如何講人話?

決定“該說(shuō)什么話”,才是對(duì)話系統(tǒng)的核心——無(wú)論是硅基的還是碳基的智能。但是深度學(xué)習(xí)在這個(gè)版塊,并沒(méi)有起到什么作用。

在當(dāng)前,處理“該說(shuō)什么”這個(gè)問(wèn)題,主流的做法是由所謂“對(duì)話管理”系統(tǒng)決定的。

盡管每一個(gè)對(duì)話系統(tǒng)背后的“對(duì)話管理”機(jī)制都不同,每家都有各種理解、各種設(shè)計(jì),但是萬(wàn)變不離其宗——目前所有任務(wù)類對(duì)話系統(tǒng),無(wú)論是前段時(shí)間的Google duplex,還是智能客服,或者智能助理,最核心的對(duì)話管理方法,有且僅有一個(gè):“填槽”,即Slot filling。

如果你并不懂技術(shù),但是又要迅速知道一家做對(duì)話AI的水平如何,到底有沒(méi)有黑科技(比如剛剛開始看AI領(lǐng)域的做投資的朋友 ),你只需要問(wèn)他一個(gè)問(wèn)題:“是不是填槽?”

如果他們(誠(chéng)實(shí)地)回答“是”,那你就可以放下心來(lái),黑科技尚未出現(xiàn)。接下來(lái),能討論的范圍,無(wú)非都是產(chǎn)品設(shè)計(jì)、工程實(shí)現(xiàn)、如何解決體驗(yàn)和規(guī)模化的困境,這類的問(wèn)題?;旧显撝钦系?,還是會(huì)智障。

要是他們回答“不是填槽”,而且產(chǎn)品的效果還很好,那么就有意思了,值得研究,或者請(qǐng)速速聯(lián)系我:)

那么這個(gè)“填槽”究竟是個(gè)什么鬼?嗯,不搞開發(fā)的大家可以簡(jiǎn)單的把它理解為“填表”:好比你要去銀行辦個(gè)業(yè)務(wù),先要填一張表。

如果這張表上的空沒(méi)有填完,柜臺(tái)小姐姐就不給你辦。她會(huì)紅筆給你圈出來(lái):“必須要填的空是這些,別的你都可以不管。” 你全部填好了,再遞給小姐姐,她就去給你辦理業(yè)務(wù)了。

還記得剛剛那個(gè)機(jī)票的例子么?用戶說(shuō)“看看明天的機(jī)票”,要想執(zhí)行“查機(jī)票”,就得做以下的步奏,還要按順序來(lái):?

1. ASR:把用戶的語(yǔ)音,轉(zhuǎn)化成文字。

2. NLU語(yǔ)義識(shí)別:識(shí)別上面的文字,屬于(之前設(shè)定好的)哪一個(gè)意圖,在這里就是“訂機(jī)票”;然后,提取文字里面的實(shí)體,“明天”作為訂票日期,被提取出來(lái)啦。

3. 填表:這個(gè)意圖是訂機(jī)票,那么就選“訂機(jī)票”這張表來(lái)填;這表里有三個(gè)空,時(shí)間那個(gè)空里,就放進(jìn)“明天”。

(這個(gè)時(shí)候,表里的3個(gè)必填項(xiàng),還差兩個(gè):“出發(fā)地”和“到達(dá)地”)

4. 開始跑之前編好的程序:如果差“出發(fā)地”,就回“從哪里走啊?”;如果差“目的地”,就回“你要去哪里?”(NLG上打引號(hào),是因?yàn)椴⒉皇钦嬲饬x上的自然語(yǔ)言生成,而是套用的對(duì)話模版)

5. TTS:把回復(fù)文本,合成為語(yǔ)音,播放出去

在上面這個(gè)過(guò)程當(dāng)中,1和2步奏都是用深度學(xué)習(xí)來(lái)做識(shí)別。如果這個(gè)環(huán)節(jié)出現(xiàn)問(wèn)題,后面就會(huì)連續(xù)出錯(cuò)。

循環(huán)1-5這個(gè)過(guò)程,只要表里還有空要填,就不斷問(wèn)用戶,直到所有的必填項(xiàng)都被填完。于是,表就可以提交小姐姐(后端處理)了。

后端看了要查的條件,返回滿足這些條件的機(jī)票情況。Agent再把查詢結(jié)果用之前設(shè)計(jì)好的回復(fù)模板發(fā)回給用戶。

順便說(shuō)一下,我們經(jīng)常聽到有些人說(shuō)“我們的多輪對(duì)話可以支持xx輪,最多的時(shí)候有用戶能說(shuō)xx輪”?,F(xiàn)在大家知道,在任務(wù)類對(duì)話系統(tǒng)里,“輪數(shù)的產(chǎn)生”是由填表的次數(shù)決定的,那么這種用“輪數(shù)多少”來(lái)衡量產(chǎn)品水平的方法,在這個(gè)任務(wù)類對(duì)話里里完全無(wú)意義。

一定要有意義,也應(yīng)該是:在達(dá)到目的、且不影響體驗(yàn)的前提下,輪數(shù)越少越好。

在當(dāng)前,只要做任務(wù)類的多輪對(duì)話,基本跑不掉填表。

5月的時(shí)候,Google I/O發(fā)布了Duplex的錄音Demo,場(chǎng)景是Google Assistant代替用戶打電話去訂餐廳,和店員溝通,幫助用戶預(yù)定位子。值得注意,這并不是Live demo。

Google's Assistant. CREDIT:GOOGLE


Google I/O 2018 Google Duplex Restaurant Call

那Google的智能助理(后稱IPA)又怎么知道用戶的具體需求呢?跑不掉的是,用戶還得給Google Assistant填一張表,用對(duì)話來(lái)交代自己的具體需求,比如下面這樣:?

圖中左邊是一個(gè)使用Google Assistant訂餐廳的真實(shí)案例,來(lái)自The Verge。


?當(dāng)前對(duì)話系統(tǒng)的局限?

我剛剛花了兩千來(lái)個(gè)字來(lái)說(shuō)明對(duì)話系統(tǒng)的通用思路。接下來(lái),要指出這個(gè)做法的問(wèn)題

還記得之前提到的 “不要日本菜”測(cè)試么?我們把這個(gè)測(cè)試套用在“訂機(jī)票”這個(gè)場(chǎng)景上,試試看:“看看明天去北京的航班,東航以外的都可以”,還是按步奏來(lái):

1. ASR語(yǔ)音轉(zhuǎn)文字,沒(méi)啥問(wèn)題;

2. 語(yǔ)義識(shí)別,貌似有點(diǎn)問(wèn)題

- 意圖:是訂機(jī)票,沒(méi)錯(cuò);

- 實(shí)體提?。焊暗挠?xùn)練來(lái);

? ? - 時(shí)間:明天

? ? - 目的地:北京

? ? - 出發(fā)地:這個(gè)用戶沒(méi)說(shuō),一會(huì)得問(wèn)問(wèn)他...

等等,他說(shuō)的這個(gè)“東航以外的都可以”,指的是啥?之前沒(méi)有訓(xùn)練過(guò)與航空公司相關(guān)的表達(dá)啊。

沒(méi)關(guān)系,咱們可以把這個(gè)表達(dá)的訓(xùn)練加上去:東航 = 航司。多找些表達(dá),只要用戶說(shuō)了各個(gè)航空公司的名字的,都訓(xùn)練成航司這個(gè)實(shí)體好啦。

另外,咱們還可以在填表的框里,添加一個(gè)航司選擇,就像這樣(黃色部分):

(嗯,好多做TO B的團(tuán)隊(duì),都是掉在這個(gè)“在后面可以加上去”的坑里。)

但是,這么理所當(dāng)然的訓(xùn)練之后,實(shí)體提取出來(lái)的航司卻是“東航”——而用戶說(shuō)的是 “東航以外的”,這又指的哪個(gè)(些)航司呢?

“要不,咱們做點(diǎn)Trick把‘以外’這樣的邏輯單獨(dú)拿出來(lái)手工處理掉?”——如果這個(gè)問(wèn)題可以這么容易處理掉,你覺(jué)得Siri等一干貨色還會(huì)是現(xiàn)在這個(gè)樣子?難度不在于“以外”提取不出來(lái),而是在處理“這個(gè)以外,是指哪個(gè)實(shí)體以外?

當(dāng)前基于深度學(xué)習(xí)的NLU在“實(shí)體提取”這個(gè)技術(shù)上,就只能提取“實(shí)體”。

而人能夠理解,在這個(gè)情況下,用戶是指的“排除掉東航以外的其他選擇”,這是因?yàn)槿顺俗觥皩?shí)體提取”以外,還根據(jù)所處語(yǔ)境,做了一個(gè)對(duì)邏輯的識(shí)別:“xx以外”。然后,自動(dòng)執(zhí)行了這個(gè)邏輯的處理,即推理,去進(jìn)一步理解,對(duì)方真正指的是什么(即指代)。

而這個(gè)邏輯推理的過(guò)程,并不存在于之前設(shè)計(jì)好的步奏(從1到5)里。

更麻煩的是,邏輯的出現(xiàn),不僅僅影響“實(shí)體”,還影響“意圖”:

“hi Siri,別推薦餐廳”——它還是會(huì)給你推薦餐廳;

“hi Siri,除了推薦餐廳,你還能推薦什么?”——它還是會(huì)給你推薦餐廳。?

中文英文都是一樣的;Google assistant也是一樣的。

想要處理這個(gè)問(wèn)題,不僅僅是要識(shí)別出“邏輯”;還要正確判斷出,這個(gè)邏輯是套用在哪個(gè)實(shí)體,或者是不是直接套用在某一個(gè)意圖上。這個(gè)判斷如何做?用什么做?都不在當(dāng)前SLU的范圍內(nèi)。

對(duì)這些問(wèn)題的處理,如果是集中在一些比較封閉的場(chǎng)景下,還可以解決個(gè)七七八八。但是,如果想要從根本上、泛化的處理,希望一次處理就解決所有場(chǎng)景的問(wèn)題,到目前都無(wú)解。在這方面,Siri是這樣,Google Assistant也是這樣,任意一家,都是這樣。

為啥說(shuō)無(wú)解?我們來(lái)看看測(cè)試。


?用圖靈測(cè)試來(lái)測(cè)對(duì)話系統(tǒng)沒(méi)用?

一說(shuō)到對(duì)人工智能進(jìn)行測(cè)試,大部分人的第一反應(yīng)是圖靈測(cè)試。

5月Google I/O大會(huì)的那段時(shí)間,我們團(tuán)隊(duì)正在服務(wù)一家全球100強(qiáng)企業(yè),為他們規(guī)劃基于AI Agent的服務(wù)。

在發(fā)布會(huì)的第二天,我收到這家客戶的Tech Office的好心提醒:Google這個(gè)像真人一樣的黑科技,會(huì)不會(huì)顛覆現(xiàn)有的技術(shù)方案?我的回答是并不會(huì)。

話說(shuō)Google Duplex在發(fā)布會(huì)上的demo確實(shí)讓人印象深刻,而且大部分看了Demo的人,都分辨不出打電話去做預(yù)定的是不是真人。

“這個(gè)效果在某種意義上,算是通過(guò)了圖靈測(cè)試?!?

Google母公司的Chairman說(shuō)google duplex可以算過(guò)了圖靈測(cè)試了

由于圖靈測(cè)試的本質(zhì)是“欺騙”?(A game of deception,詳見Toby Walsh的論文),所以很多人批評(píng)它,這只能用來(lái)測(cè)試人有多好騙,而不是用來(lái)測(cè)智能的。在這一點(diǎn)上,我們?cè)诤笪腜art 4對(duì)話的本質(zhì)中會(huì)有更多解釋。

人們被這個(gè)Demo騙到的主要原因,是因?yàn)楹铣傻恼Z(yǔ)音非常像真人。

這確實(shí)是Duplex最牛的地方:語(yǔ)音合成。不得不承認(rèn),包括語(yǔ)氣、音調(diào)等等模擬人聲的效果,確實(shí)是讓人嘆為觀止。只是,單就在語(yǔ)音合成方面,就算是做到極致,在本質(zhì)上就是一只鸚鵡——最多可以騙騙Alexa(所以你看活體識(shí)別有多么重要)。

只是,Google演示的這個(gè)對(duì)話系統(tǒng),一樣處理不了邏輯推理、指代這類的問(wèn)題。這意味著,就它算能過(guò)圖靈測(cè)試,也過(guò)不了Winograd Schema Challenge測(cè)試。

相比圖靈測(cè)試,這個(gè)測(cè)試是直擊深度學(xué)習(xí)的要害。當(dāng)人類對(duì)句子進(jìn)行語(yǔ)法分析時(shí),會(huì)用真實(shí)世界的知識(shí)來(lái)理解指代的對(duì)象。這個(gè)測(cè)試的目標(biāo),就是測(cè)試目前深度學(xué)習(xí)欠缺的常識(shí)推理能力。

如果我們用Winograd Schema Challenge的方法,來(lái)測(cè)試AI在“餐廳推薦”這個(gè)場(chǎng)景里的水平,題目會(huì)是類似這樣的:

A. “四川火鍋比日料更好,因?yàn)樗芾薄?/p>

B. “四川火鍋比日料更好,因?yàn)樗焕薄?/p>

AI需要能準(zhǔn)確指出:在A句里,“它”指的是四川火鍋;而在B句里,“它”指的則是日料。

還記得在本文Part 1里提到的那個(gè)“不要日本菜測(cè)試”么?我真的不是在強(qiáng)調(diào)“回字有四種寫法”——這個(gè)測(cè)試的本質(zhì),是測(cè)試對(duì)話系統(tǒng)能不能使用簡(jiǎn)單邏輯來(lái)做推理(指代的是什么)。

而在Winograd Schema Challenge中,則是用世界知識(shí)(包括常識(shí))來(lái)做推理:

如果系統(tǒng)不知道相應(yīng)的常識(shí)(四川火鍋是辣的;日料是不辣的),就沒(méi)有推理的基礎(chǔ)。更不用說(shuō)推理還需要被準(zhǔn)確地執(zhí)行。

有人說(shuō),我們可以通過(guò)上下文處理來(lái)解決這個(gè)問(wèn)題。不好意思,上面這個(gè)常識(shí)根本就沒(méi)有出現(xiàn)在整個(gè)對(duì)話當(dāng)中。不在“上文”里面,又如何處理?

對(duì)于這個(gè)部分的詳細(xì)解釋,請(qǐng)看下一章 (Part 3 對(duì)話的本質(zhì))。

盡管指代問(wèn)題和邏輯問(wèn)題,看上去,在應(yīng)用方面已經(jīng)足夠致命了;但這些也只是深度學(xué)習(xí)表現(xiàn)出來(lái)的諸多局限性中的一部分。

哪怕更進(jìn)一步,再過(guò)一段時(shí)間,有一家AI在Winograd Schema Challenge拿了100%的正確率,我們也不能期望它在自然語(yǔ)言處理中的表現(xiàn)如同人一樣,因?yàn)檫€有更嚴(yán)重和更本質(zhì)的問(wèn)題在后面等著。


?對(duì)話系統(tǒng)更大的挑戰(zhàn)不是NLU?

我們來(lái)看問(wèn)題表現(xiàn)在什么地方。

現(xiàn)在我們知道了,當(dāng)人跟現(xiàn)在的AI對(duì)話的時(shí)候,AI能識(shí)別你說(shuō)的話,是靠深度學(xué)習(xí)對(duì)你說(shuō)出的自然語(yǔ)言進(jìn)行分類,歸于設(shè)定好的意圖,并找出來(lái)文本中有哪些實(shí)體。

而AI什么時(shí)候回答你,什么時(shí)候反問(wèn)你,基本都取決于背后的“對(duì)話管理”系統(tǒng)里面的各種表上還有啥必填項(xiàng)沒(méi)有填完。而問(wèn)你的話,則是由產(chǎn)品經(jīng)理和代碼小哥一起手動(dòng)完成的。

那么,這張表是誰(shuí)做的?

或者說(shuō),是誰(shuí)決定,對(duì)于“訂機(jī)票”這件事,要考慮哪些方面?要獲得哪些信息?需要問(wèn)哪些問(wèn)題?機(jī)器又是怎么知道的?

是人。是產(chǎn)品經(jīng)理,準(zhǔn)確點(diǎn)說(shuō)。

就像剛才的“訂機(jī)票”的案例,當(dāng)用戶問(wèn)到“航司”的時(shí)候,之前的表里并沒(méi)有設(shè)計(jì)這個(gè)概念,AI就無(wú)法處理了。

要讓AI能處理這樣的新條件,得在“訂機(jī)票”這張表上,新增加“航空公司”一欄(黃色部分)。而這個(gè)過(guò)程,都得人為手動(dòng)完成:產(chǎn)品經(jīng)理設(shè)計(jì)好后,工程師編程完成這張表的編程。

所以AI并不是真的,通過(guò)案例學(xué)習(xí)就自動(dòng)理解了“訂機(jī)票”這件事情,包含了哪些因素。只要這個(gè)表還是由人來(lái)設(shè)計(jì)和編程實(shí)現(xiàn)的,在產(chǎn)品層面,一旦用戶稍微談及到表以外的內(nèi)容,智障的情況就自然出現(xiàn)了。

因此,當(dāng)Google duplex出現(xiàn)的時(shí)候,我并不那么關(guān)心 Google duplex發(fā)音和停頓有多像一個(gè)人——實(shí)際上,當(dāng)我觀察任意一個(gè)對(duì)話系統(tǒng)的時(shí)候,我都只關(guān)心1個(gè)問(wèn)題:

“是誰(shuí)設(shè)計(jì)的那張表:人,還是AI?”

只是,深度學(xué)習(xí)在對(duì)話系統(tǒng)里面,能做的只是識(shí)別用戶講出的那句話那部分——嚴(yán)格依照被人為訓(xùn)練的那樣(監(jiān)督學(xué)習(xí))。至于其他方面,比如該講什么話?該在什么時(shí)候講話?它都無(wú)能為力。

但是真正人們?cè)趯?duì)話時(shí)的過(guò)程,卻不是上面提到的對(duì)話系統(tǒng)這么設(shè)計(jì)的,而且相差十萬(wàn)八千里。人的對(duì)話,又是怎么開展的?這個(gè)差異究竟在哪里?為什么差異那么大?所謂深度學(xué)習(xí)很難搞定的地方,是人怎么搞定的呢?畢竟在這個(gè)星球上,我們自身就是70億個(gè)完美的自然語(yǔ)言處理系統(tǒng)呢。

我們需要了解要解決的問(wèn)題,才可能開展解決問(wèn)題的工作。在對(duì)話領(lǐng)域,我們需要知道人們對(duì)話的本質(zhì)是什么。下一章比較燒腦,我們將討論“思維”這件事情,是如何主導(dǎo)人們的對(duì)話的。



關(guān)于作者

作者M(jìn)ingke,正在從事對(duì)話智能方面的創(chuàng)業(yè),為世界一百?gòu)?qiáng)企業(yè)提供對(duì)話智能應(yīng)用的咨詢和解決方案。上次《為什么現(xiàn)在的人工智能助理都像人工智障》一文發(fā)出來(lái)之后,認(rèn)識(shí)結(jié)交了不少行業(yè)內(nèi)的朋友。希望這次,把過(guò)去一段時(shí)間的思考與大家分享,能給行業(yè)內(nèi)的新老朋友們一些啟發(fā),有興趣溝通和碰撞的也歡迎與我聯(lián)系。

歡迎行業(yè)里的新老朋友勾搭吐槽,微信:mingke27 (請(qǐng)注明稱呼+所在機(jī)構(gòu))

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容