“?Artificial-Intelligently Challenged?”

前言

大家好，我又出來(lái)懟人了。

兩年前，寫了一篇文章《為什么現(xiàn)在的人工智能助理都像人工智障》，當(dāng)時(shí)主要是懟“智能助理們”。這次呢則是表達(dá)?“我不是針對(duì)誰(shuí)，只是現(xiàn)在所有的深度學(xué)習(xí)都搞不定對(duì)話AI”，以及“你看都這樣了，那該怎么做AI產(chǎn)品”。

閱讀門檻?

時(shí)間：這篇真的太長(zhǎng)了（近3萬(wàn)字）根據(jù)預(yù)覽同學(xué)們的反饋，通常第一次閱讀到Part 3時(shí)，會(huì)消耗很多精力，但讀完P(guān)art 3才發(fā)現(xiàn)是精華（同時(shí)也是最燒腦的部分）。請(qǐng)大家酌情安排閱讀時(shí)間。

可讀性：我會(huì)在內(nèi)容里邀請(qǐng)你一起思考（無(wú)需專業(yè)知識(shí)），所以可能不適合通勤時(shí)間閱讀。你的閱讀收益取決于在過(guò)程中思考的參與程度。

適合人群：對(duì)話智能行業(yè)從業(yè)者、AIPM、關(guān)注AI的投資人、對(duì)AI有強(qiáng)烈興趣的朋友、關(guān)心自己的工作會(huì)不會(huì)被AI代替的朋友；

關(guān)于鏈接：閱讀本文時(shí)，無(wú)需閱讀每個(gè)鏈接里的內(nèi)容，這并不會(huì)影響對(duì)本文的理解。

關(guān)于“人工智障”四個(gè)字

上一片文章發(fā)出后，有朋友跟我說(shuō)，標(biāo)題里的“人工智障”這個(gè)詞貌似有點(diǎn)offensive。作為學(xué)語(yǔ)言出身的，我來(lái)解釋一下這個(gè)原因：

最開始呢，我是在跟一位企業(yè)咨詢顧問(wèn)聊人工智能這個(gè)賽道的現(xiàn)狀。因?yàn)閷?duì)話是用英語(yǔ)展開的，當(dāng)時(shí)為了表達(dá)我的看法? “現(xiàn)在的智能助理行業(yè)正處在一種難以逾越的困境當(dāng)中”，我就跟她說(shuō)“Currently all the digital assistants are Artificial-Intelligently challenged”。

她聽了之后哈哈一笑?！癷ntelligently challenged”同時(shí)也是英文中對(duì)智障的委婉表達(dá)。假設(shè)不了解這個(gè)常識(shí)，她就可能忽略掉這個(gè)梗，盡管能明白核心意思，只是不會(huì)覺(jué)得有什么好笑的。那么信息在傳遞中就有損失。

寫文章時(shí)，我把這個(gè)信息翻譯成中文，就成了“人工智障”。但是因?yàn)橹形恼Z(yǔ)法的特性，有些信息就lost in translation了。比如實(shí)際表達(dá)的是“一種困境的狀態(tài)”而不是“一件事”。

（順便說(shuō)一下，中文的智障，實(shí)際上是政治正確的稱呼，詳見特殊奧運(yùn)會(huì)的用詞方法。）

為什么要寫那么多字來(lái)解釋這個(gè)措辭？因?yàn)?b>不同的人，看見相同的字，也會(huì)得到不同的理解。這也是我們要討論的重點(diǎn)之一。

那么，我們開始吧。

Part 1?

對(duì)話智能的表現(xiàn)：智障

Sophia in?AI for Good Global Summit 2017.Source:??ITU

2017年10月，上圖這個(gè)叫Sophia的機(jī)器人，被沙特阿拉伯授予了正式的公民身份。公民身份，這個(gè)評(píng)價(jià)比圖靈測(cè)試還要牛。何況還是在沙特，他們才剛剛允許女性開車不久（2017年9月頒布的法令）。

Sophia經(jīng)常參加各種會(huì)、“發(fā)表演講”、“接受采訪”，比如去聯(lián)合國(guó)對(duì)話，表現(xiàn)出來(lái)非常類似人類的言談；去和Will Smith拍MV；接受Good morning Britain之類的主流媒體的采訪；甚至公司創(chuàng)始人參加Jim Fallon的訪談時(shí)一本正經(jīng)的說(shuō)Sophia是“basically alive”。

Basically alive. 要知道，西方的吃瓜群眾都是看著《終結(jié)者》長(zhǎng)大的，前段時(shí)間還看了《西部世界》。在他們的世界模型里，“機(jī)器智能會(huì)覺(jué)醒” 這個(gè)設(shè)定是遲早都會(huì)發(fā)生的。

普通大眾開始嚇得瑟瑟發(fā)抖。不僅開始擔(dān)心自己的工作是不是會(huì)被替代，還有很多人開始擔(dān)心AI會(huì)不會(huì)統(tǒng)治人類，這樣的話題展開?！拔磥?lái)已來(lái)”，很多人都以為真正的人工智能已經(jīng)近在咫尺了。

只是，有些人可能會(huì)注意到有些不合理的地方：“等等，人工智能都要威脅人類了，為啥我的Siri還那么蠢？”

Source:?Dumb And Dumber: Comparing Alexa, Siri, Cortana And The Google Assistant, Forbes, May 2018

我們來(lái)看看到2018年末在對(duì)話智能領(lǐng)域，各方面究竟發(fā)展的如何了。

?“?不要日本菜?”

我在2016年底做過(guò)一個(gè)測(cè)試，對(duì)幾個(gè)智能助理提一個(gè)看似簡(jiǎn)單的需求：“推薦餐廳，不要日本菜”。只是各家的AI助理都會(huì)給出一堆餐廳推薦，全是日本菜。

2年過(guò)去了，在這個(gè)問(wèn)題的處理上有進(jìn)展么？我們又做了一次測(cè)試：?

結(jié)果是依然沒(méi)有解決?！安灰眱蓚€(gè)字被所有助理一致忽略了。

為什么要關(guān)注“不要”兩個(gè)字？之前我去到一家某非常有名的智能語(yǔ)音創(chuàng)業(yè)公司，聊到這個(gè)問(wèn)題時(shí)，他家的PM顯出疑惑：“這個(gè)邏輯處理有什么用？我們后臺(tái)上看到用戶很少提出這類表達(dá)啊?！?/p>

聽到這樣的評(píng)論，基本可以確定：這家公司還沒(méi)有深入到專業(yè)服務(wù)對(duì)話領(lǐng)域。

場(chǎng)景方面，一旦深入進(jìn)服務(wù)領(lǐng)域里的多輪對(duì)話，很容易會(huì)遇到類似這樣的表達(dá) ：“我不要這個(gè)，有更便宜的么？”。后臺(tái)沒(méi)有遇到，只能說(shuō)用戶還沒(méi)開始服務(wù)就結(jié)束了。場(chǎng)景方面與AI公司的domain選擇有關(guān)。

但是在技術(shù)方面，則是非常重要的。因?yàn)檫@正是真正智能的核心特點(diǎn)。我們將在part 2&3詳細(xì)聊聊這個(gè)問(wèn)題?，F(xiàn)在先拋個(gè)結(jié)論：這個(gè)問(wèn)題解決不了，智能助理會(huì)一直智障下去的。

“??To C 團(tuán)隊(duì)轉(zhuǎn) To B”

自從2015年幾個(gè)重要的深度學(xué)習(xí)在開發(fā)者當(dāng)中火了起來(lái)，大小公司都想做“Her”這樣面對(duì)個(gè)人消費(fèi)者的通用型智能助理（To C類產(chǎn)品的終極目標(biāo)）。一波熱錢投給最有希望的種子隊(duì)伍（擁有Fancy背景）之后，全滅。目前為止，在2C這方面的所有商用產(chǎn)品，無(wú)論是巨頭還是創(chuàng)業(yè)公司，全部達(dá)不到用戶預(yù)期。

在人們的直覺(jué)里，會(huì)認(rèn)為“智能助理”，處理的是一些日常任務(wù)，不涉及專業(yè)的需求，應(yīng)該比“智能專家”好做。這是延續(xù)“人”的思路。推薦餐廳、安排行程是人人都會(huì)做的事情；卻只有少數(shù)受過(guò)專業(yè)訓(xùn)練的人能夠處理金融、醫(yī)療問(wèn)診這類專業(yè)問(wèn)題。

而對(duì)于現(xiàn)在的AI，情況正好相反?，F(xiàn)在能造出在圍棋上打敗柯潔的AI，但是卻造不出來(lái)能給柯潔管理日常生活的AI。

隨著to C助理賽道的崩盤，To B or not to B已經(jīng)不再是問(wèn)題，因?yàn)橐呀?jīng)沒(méi)得選了，只能To B。這不是商業(yè)模式上的選擇，而是技術(shù)的限制。目前To B，特別是限定領(lǐng)域的產(chǎn)品，相對(duì)To C類產(chǎn)品更可行：一個(gè)原因是領(lǐng)域比較封閉，用戶從思想到語(yǔ)言，不容易發(fā)揮跑題；另一方面則是數(shù)據(jù)充分。

只是To B的公司都很容易被當(dāng)成是做“外包”的。因?yàn)榭蛻羰且粋€(gè)個(gè)談下來(lái)的，項(xiàng)目是一個(gè)個(gè)交付的，這意味著增長(zhǎng)慢，靠人堆，沒(méi)有復(fù)利帶來(lái)的指數(shù)級(jí)增長(zhǎng)。大家紛紛表示不開心。

這個(gè)“幫人造機(jī)器人”的業(yè)務(wù)有點(diǎn)像“在網(wǎng)頁(yè)時(shí)代幫人建站”。轉(zhuǎn)成To B的團(tuán)隊(duì)經(jīng)常受到資本的質(zhì)疑： “你這個(gè)屬于做項(xiàng)目，怎么規(guī)?；?？”

要知道，國(guó)內(nèi)的很多投資機(jī)構(gòu)和里面的投資經(jīng)理入行的時(shí)間，是在國(guó)內(nèi)的移動(dòng)互聯(lián)起來(lái)的那一波?！癝calability”或者“高速增長(zhǎng)”是體系里最重要的指標(biāo)，沒(méi)有之一。而做項(xiàng)目這件事，就是Case by case，要增長(zhǎng)就要堆人，也就很難出現(xiàn)指數(shù)級(jí)增長(zhǎng)。這就有點(diǎn)尷尬了。

“你放心，我有SaaS！哦不，是AIaaS。我可以打造一個(gè)平臺(tái)，上面有一系列工具，可以讓客戶們自己組裝機(jī)器人?！?

然而，這些想做技能平臺(tái)的創(chuàng)業(yè)公司，也沒(méi)有一個(gè)成功的。短期也不可能成功。

Yann LeCun對(duì)AIaas的看法

主要的邏輯是這樣的：你給客戶提供工具，但他需要的是雕像——這中間還差了一個(gè)雕塑家。佐證就是那些各家試圖開放“對(duì)話框架”給更小的開發(fā)者，甚至是服務(wù)提供者，幫助他們“3分鐘開發(fā)出自己的AI機(jī)器人”，具體就不點(diǎn)名了。自己都開發(fā)不出來(lái)一個(gè)讓人滿意的產(chǎn)品，還想抽象一個(gè)范式出來(lái)讓別人沿用你的（不work的）框架？

不過(guò)，我認(rèn)為MLaaS在長(zhǎng)期的成功是有可能的，但還需要行業(yè)發(fā)展更為成熟的時(shí)候，現(xiàn)在為時(shí)尚早。具體分析我們?cè)诤竺鍼art 5會(huì)談到。

“?音箱的成功和智能的失敗 ”

對(duì)話這個(gè)領(lǐng)域，另一個(gè)比較火的賽道是智能音箱。

各大主要科技公司都出了自己的智能音箱，騰訊叮當(dāng)、阿里的天貓精靈、小米音箱、國(guó)外的Alexa、Google的音箱等等。作為一個(gè)硬件品類，這其實(shí)是個(gè)還不錯(cuò)的生意，基本屬于制造業(yè)。

不僅出貨不差，還被寄予期望，能夠成為一個(gè)生態(tài)的生意——核心邏輯看上去也是充滿想象力的：

超級(jí)終端：在后移動(dòng)時(shí)代，每家都想像iphone一樣搶用戶的入口。只要用戶習(xí)慣使用語(yǔ)音來(lái)獲得咨詢或者服務(wù)，甚至可以像Xbox/ps一樣，硬件賠錢賣，軟件來(lái)掙錢；

用語(yǔ)音做OS：開發(fā)者打造各類語(yǔ)音的技能，然后通過(guò)大量“離不開的技能” 反哺這個(gè)OS的市場(chǎng)占有；

提供開發(fā)者平臺(tái)：像Xcode一樣，給開發(fā)者提供應(yīng)用開發(fā)的工具和分發(fā)平臺(tái)、提供使用服務(wù)的流量。

可是，這些技能使用的實(shí)際情況是這樣的：?

Source:?Statista

萬(wàn)眾期待的killer app并沒(méi)有出現(xiàn)；

基本沒(méi)有商業(yè)服務(wù)型的應(yīng)用；

技能開發(fā)者都沒(méi)賺到錢，也不知道怎么賺錢；

大部分高頻使用的技能都沒(méi)有商業(yè)價(jià)值——用戶用的最多的就是“查天氣”

沒(méi)有差異性：智能的差異嘛基本都沒(méi)有的事兒。

“?皇帝的新人工智能?”

回過(guò)頭來(lái)，我們?cè)賮?lái)看剛剛那位沙特阿拉伯的公民，Sophia。既然剛剛提到的那么多公司投入了那么多錢和科學(xué)家，都搞成這樣，憑什么這個(gè)Sophia能一鳴驚人？

因?yàn)镾ophia的“智能” 是個(gè)騙局。

可以直接引用Yann LeCun對(duì)此的評(píng)價(jià)， “這完全是鬼扯”。?

簡(jiǎn)單來(lái)說(shuō)，Sophia是一個(gè)帶喇叭的木偶——在各種大會(huì)上的發(fā)言和采訪的內(nèi)容都是人工撰寫，然后用人人都有的語(yǔ)音合成做輸出。卻被宣傳成為是其“人工智能”的自主意識(shí)言論。

這還能拿“公民身份”，可能是人類公民被黑的最慘的一次。這感覺(jué)，好像是我家的橘貓被一所985大學(xué)授予了土木工程學(xué)士學(xué)位。

其實(shí)對(duì)話系統(tǒng)里，用人工來(lái)撰寫內(nèi)容，或者使用模版回復(fù)，這本來(lái)就是現(xiàn)在技術(shù)的現(xiàn)狀（在后面我們會(huì)展開）。

但刻意把“非智能”的產(chǎn)物說(shuō)成是“智能”的表現(xiàn)，這就不對(duì)了。

考慮到大部分吃瓜群眾是通過(guò)媒體渠道來(lái)了解當(dāng)前技術(shù)發(fā)展的，跟著炒作的媒體（比如被點(diǎn)名的Tech Insider）都是這場(chǎng)騙局的共犯。這些不知道是無(wú)知還是無(wú)良的文科生，真的沒(méi)有做好新聞工作者份內(nèi)的調(diào)查工作。

最近這股妖風(fēng)也吹到了國(guó)內(nèi)的韭菜園里。?

Sophia出現(xiàn)在了王力宏的一首講AI的MV里；然后又2018年11月跑去給大企業(yè)站臺(tái)。

真的，行業(yè)內(nèi)認(rèn)真做事兒的小伙伴，都應(yīng)該站出來(lái)，讓大家更清晰的知道現(xiàn)在AI——或者說(shuō)機(jī)器學(xué)習(xí)的邊界在哪兒。不然甲方爸爸們信以為真了，突然指著sophia跟你說(shuō)，“ 別人都能這么自然，你也給我整一個(gè)?！?/p>

你怕不得裝個(gè)真人進(jìn)去？

對(duì)了，說(shuō)到這兒，確實(shí)現(xiàn)在也有：用人——來(lái)偽裝成人工智能——來(lái)模擬人，為用戶服務(wù)。

Source:?The?Guardian

國(guó)內(nèi)的案例典型的就是銀行用的大堂機(jī)器人，其實(shí)是真人在遠(yuǎn)程語(yǔ)音（所謂Tele presence）。美國(guó)有X.ai，做基于Email的日程管理的。只是這個(gè)AI到了下午5點(diǎn)就要下班。

當(dāng)然，假如我是這些騙局背后開發(fā)者，被質(zhì)疑的時(shí)候，我還可以強(qiáng)行拉回人工智能上：“這么做是為了積累真正的對(duì)話數(shù)據(jù)，以后用來(lái)做真的AI對(duì)話系統(tǒng)識(shí)別的訓(xùn)練。”

這么說(shuō)對(duì)外行可能是毫無(wú)破綻的。但是真正行業(yè)內(nèi)干正經(jīng)事的人，都應(yīng)該像傅盛那樣站出來(lái)，指明這些做法是騙人：“全世界沒(méi)有一家能做出來(lái)......做不到，一定做不到”。

人家沙特是把AI當(dāng)成人，這些套路是把人當(dāng)成AI。然后大眾就開始分不清楚究竟什么是AI了。

“?人工智能究竟（tmd）指的是什么？”

另一方面，既然AI現(xiàn)在的那么蠢，為什么馬一龍 (Elon Musk) 卻說(shuō)“AI很有可能毀滅人類”；霍金甚至直接說(shuō)?“AI可能是人類文明里最糟糕的事件”。

而在另一邊，F(xiàn)acebook和Google的首席科學(xué)家卻在說(shuō)，現(xiàn)在的AI都是渣渣，根本不需要擔(dān)心，甚至應(yīng)該推翻重做。

大家該相信誰(shuí)的？一邊是要去火星的男人，和說(shuō)不定已經(jīng)去了火星的男人；另一邊是當(dāng)前兩家科技巨頭的領(lǐng)軍人物。

其實(shí)他們說(shuō)的都對(duì)，因?yàn)檫@里說(shuō)到的“人工智能”是兩碼事。

馬一龍和霍金擔(dān)心的人工智能，是由人造出來(lái)的真正的智能，即通用人工智能（AGI, Artificial General Intelligence）甚至是超級(jí)智能（Super Intelligence）。

而Yann LeCun 和Hinton指的人工智能則是指的當(dāng)前用來(lái)實(shí)現(xiàn)“人工智能效果”的技術(shù)（基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)）。這兩位的觀點(diǎn)是“用這種方式來(lái)實(shí)現(xiàn)人工智能是行不通的”。

兩者本質(zhì)是完全不同的，一個(gè)指的是結(jié)果，一個(gè)指的是（現(xiàn)在的）過(guò)程。

那么當(dāng)我們?cè)谟懻撊斯ぶ悄艿臅r(shí)候，究竟在說(shuō)什么？

John McCathy

John McCathy在1956年和Marvin Minsky，Nathaniel Rochester 以及Claude Shannon在達(dá)特貌似研討會(huì)上打造了AI這個(gè)詞，但是到目前為止，學(xué)界工業(yè)界并沒(méi)有一個(gè)統(tǒng)一的理解。

最根本的問(wèn)題是目前人類對(duì)“智能”的定義還不夠清楚。何況人類本身是否是智能的最佳體現(xiàn)，還不一定呢。想想每天打交道的一些人：）

一方面，在大眾眼中，人工智能是 “人造出來(lái)的，像人的智能”，比如Siri。同時(shí)，一個(gè)AI的水平高低，則取決于它有多像人。所以當(dāng)Sophia出現(xiàn)在公眾眼中的時(shí)候，普通人會(huì)很容易被蒙蔽（甚至能通過(guò)圖靈測(cè)試）。?

Oracle對(duì)AI的定義也是 “只要是能讓計(jì)算機(jī)可以模擬人類行為的技術(shù)，都算！”

而另一方面，從字面上來(lái)看“Artificial Intelligence”，只要是人造的智能產(chǎn)品，理論上都算作人工智能。?

也就是說(shuō)，一個(gè)手持計(jì)算器，盡管不像人，也應(yīng)算是人工智能產(chǎn)品。但我相信大多數(shù)人都不會(huì)把計(jì)算器當(dāng)成是他們所理解的人工智能。

這些在認(rèn)識(shí)上不同的解讀，導(dǎo)致當(dāng)前大家對(duì)AI應(yīng)用的期望和評(píng)估都有很多差異。

再加上還有“深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)” 這些概念紛紛跟著人工智能一起出現(xiàn)。但是各自意味著什么，之間是什么關(guān)系，普通大眾都不甚了解。

“ 沒(méi)關(guān)系，韭菜不用懂?！?但是想要割韭菜的人，最好能搞清楚吧。連有些投資人自己也分不清，你說(shuō)怎么做判斷，如何投項(xiàng)目？當(dāng)然是投胸大的。

以上，就是到2018年末，在對(duì)話領(lǐng)域的人工智能的現(xiàn)狀：智能助理依然智障；大部分To B的給人造機(jī)器人的都無(wú)法規(guī)?；?；對(duì)話方面沒(méi)有像AlphaZero在圍棋領(lǐng)域那樣的讓人震驚的產(chǎn)品；沒(méi)有商業(yè)上大規(guī)模崛起的跡象；有的是一團(tuán)渾水，和渾水摸魚的人。

為什么會(huì)這樣？為什么人工智能在圖像識(shí)別，人臉識(shí)別，下圍棋這些方面都那么快的進(jìn)展，而在對(duì)話智能這個(gè)領(lǐng)域卻是如此混亂？

既然你都看到這里了，我相信你是一個(gè)愿意探究本質(zhì)的好同志。那么我們來(lái)了解，對(duì)話的本質(zhì)是什么；以及現(xiàn)在的對(duì)話系統(tǒng)的本質(zhì)又是什么。

Part 2 當(dāng)前對(duì)話系統(tǒng)的本質(zhì)：填表

“?AI thinks, man laughs?”

Source:The Globe and Mail

有一群小雞出生在一個(gè)農(nóng)場(chǎng)，無(wú)憂無(wú)慮安心地生活。

雞群中出現(xiàn)了一位科學(xué)家，它注意到了一個(gè)現(xiàn)象：每天早上，食槽里會(huì)自動(dòng)出現(xiàn)糧食。

作為一名優(yōu)秀的歸納法信徒(Inductivist)，這只科學(xué)雞并不急于給出結(jié)論。它開始全面觀察并做好記錄，試圖發(fā)現(xiàn)這個(gè)現(xiàn)象是否在不同的條件下都成立。

“星期一是這樣，星期二是這樣；樹葉變綠時(shí)是這樣，樹葉變黃也是這樣；天氣冷是這樣，天氣熱也是這樣；下雨是這樣，出太陽(yáng)也是這樣！”?

每天的觀察，讓它越來(lái)越興奮，在心中，它離真相越來(lái)越接近。直到有一天，這只科學(xué)雞再也沒(méi)有觀察到新的環(huán)境變化，而到了當(dāng)天早上，雞舍的門一打開，它跑到食槽那里一看，依然有吃的！

科學(xué)雞，對(duì)他的小伙伴，志在必得地宣布：“我預(yù)測(cè)，每天早上，槽里會(huì)自動(dòng)出現(xiàn)食物。明天早上也會(huì)有！以后都會(huì)有！我們不用擔(dān)心餓死了！”

經(jīng)過(guò)好幾天，小伙伴們都驗(yàn)證了這個(gè)預(yù)言，科學(xué)雞驕傲的并興奮的把它歸納成“早起的小雞有食吃定理”。

正好，農(nóng)場(chǎng)的農(nóng)夫路過(guò)，看到一只興奮的雞不停的咯咯叫，他笑了：“這只雞很可愛(ài)哦，不如把它做成叫花雞好了” 。

科學(xué)雞，卒于午飯時(shí)間。

在這個(gè)例子里，這只羅素雞（Bertrand Russell’s chicken）只對(duì)現(xiàn)象進(jìn)行統(tǒng)計(jì)和歸納，不對(duì)原因進(jìn)行推理。

而主流的基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)，也是通過(guò)大量的案例，靠對(duì)文本的特征進(jìn)行歸類，來(lái)實(shí)現(xiàn)對(duì)識(shí)別語(yǔ)義的效果。這個(gè)做法，就是羅素雞。

目前，這是對(duì)話式人工智能的主流技術(shù)基礎(chǔ)。其主要應(yīng)用方向，就是對(duì)話系統(tǒng)，或稱為Agent。之前提到的智能助理Siri，Cortana，Google Assistant以及行業(yè)里面的智能客服這些都算是對(duì)話智能的應(yīng)用。

“?對(duì)話智能的黑箱?”

這些產(chǎn)品的交互方式，是人類的自然語(yǔ)言，而不是圖像化界面。

圖形化界面（GUI）的產(chǎn)品，比如網(wǎng)頁(yè)或者APP的產(chǎn)品設(shè)計(jì)，是所見即所得、界面即功能。

對(duì)話智能的交互（CUI, Conversational UI）是個(gè)黑箱：終端用戶能感知到自己說(shuō)出的話（輸入）和機(jī)器人的回答（輸出）——但是這個(gè)處理的過(guò)程是感覺(jué)不到的。就好像跟人說(shuō)話，你并不知道他是怎么想的。

每一個(gè)對(duì)話系統(tǒng)的黑箱里，都是開發(fā)者自由發(fā)揮的天地。

雖說(shuō)每家的黑箱里面都不同，但是最底層的思路，都萬(wàn)變不離其宗，核心就是兩點(diǎn)：聽人話（識(shí)別）+?講人話（對(duì)話管理）。

如果你是從業(yè)人員，那么請(qǐng)回答一個(gè)問(wèn)題：你們家的對(duì)話管理是不是填槽？若是，你可以跳過(guò)這一節(jié)（主要科普填槽是怎么回事），請(qǐng)直接到本章的第五節(jié)“當(dāng)前對(duì)話系統(tǒng)的局限” 。

“?AI如何聽懂人話？”

對(duì)話系統(tǒng)這個(gè)事情在2015年開始突然火起來(lái)了，主要是因?yàn)橐粋€(gè)技術(shù)的普及：機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)帶來(lái)的語(yǔ)音識(shí)別和NLU(自然語(yǔ)言理解)——主要解決的是識(shí)別人講的話。

這個(gè)技術(shù)的普及讓很多團(tuán)隊(duì)都掌握了一組關(guān)鍵技能：意圖識(shí)別和實(shí)體提取。這意味著什么？我們來(lái)看一個(gè)例子。

在生活中，如果想要訂機(jī)票，人們會(huì)有很多種自然的表達(dá)：

“訂機(jī)票”；

“有去上海的航班么？”；

“看看航班，下周二出發(fā)去紐約的”；

“要出差，幫我查下機(jī)票”；

等等等等

可以說(shuō)“自然的表達(dá)” 有無(wú)窮多的組合（自然語(yǔ)言）都是在代表 “訂機(jī)票” 這個(gè)意圖的。而聽到這些表達(dá)的人，可以準(zhǔn)確理解這些表達(dá)指的是“訂機(jī)票”這件事。

而要理解這么多種不同的表達(dá)，對(duì)機(jī)器是個(gè)挑戰(zhàn)。在過(guò)去，機(jī)器只能處理“結(jié)構(gòu)化的數(shù)據(jù)”（比如關(guān)鍵詞），也就是說(shuō)如果要聽懂人在講什么，必須要用戶輸入精確的指令。

所以，無(wú)論你說(shuō)“我要出差”還是“幫我看看去北京的航班”，只要這些字里面沒(méi)有包含提前設(shè)定好的關(guān)鍵詞“訂機(jī)票”，系統(tǒng)都無(wú)法處理。而且，只要出現(xiàn)了關(guān)鍵詞，比如“我要退訂機(jī)票”里也有這三個(gè)字，也會(huì)被處理成用戶想要訂機(jī)票。

自然語(yǔ)言理解這個(gè)技能出現(xiàn)后，可以讓機(jī)器從各種自然語(yǔ)言的表達(dá)中，區(qū)分出來(lái)，哪些話歸屬于這個(gè)意圖；而那些表達(dá)不是歸于這一類的，而不再依賴那么死板的關(guān)鍵詞。比如經(jīng)過(guò)訓(xùn)練后，機(jī)器能夠識(shí)別“幫我推薦一家附近的餐廳”，就不屬于“訂機(jī)票”這個(gè)意圖的表達(dá)。

并且，通過(guò)訓(xùn)練，機(jī)器還能夠在句子當(dāng)中自動(dòng)提取出來(lái)“上海”，這兩個(gè)字指的是目的地這個(gè)概念（即實(shí)體）；“下周二”指的是出發(fā)時(shí)間。

這樣一來(lái)，看上去“機(jī)器就能聽懂人話啦！”。

這個(gè)技術(shù)為啥會(huì)普及？主要是因?yàn)闄C(jī)器學(xué)習(xí)領(lǐng)域的學(xué)術(shù)氛圍，導(dǎo)致重要的論文基本都是公開的。不同團(tuán)隊(duì)要做的是考慮具體工程實(shí)施的成本。

最后的效果，就是在識(shí)別自然語(yǔ)言這個(gè)領(lǐng)域里，每家的基礎(chǔ)工具都差不多。在意圖識(shí)別和實(shí)體提取的準(zhǔn)確率，都是百分點(diǎn)的差異。既然這個(gè)工具本身不是核心競(jìng)爭(zhēng)力，甚至你可以用別家的，大把可以選，但是關(guān)鍵是你能用它來(lái)干什么？

“Due to the academic culture that ML comes from, pretty much all of the primary science is published as soon as it’s created - almost everything new is a paper that you can read and build with. But what do you build? ”——Benedict Evans （A16Z合伙人）

在這方面，最顯而易見的價(jià)值，就是解放雙手。語(yǔ)音控制類的產(chǎn)品，只需要聽懂用戶的自然語(yǔ)言，就去執(zhí)行這個(gè)操作：在家里要開燈，可以直接說(shuō) “開燈”，而不用去按開關(guān)；在車上，說(shuō)要“開天窗”，天窗就打開了，而不用去找對(duì)應(yīng)的按鈕在哪里。

這類系統(tǒng)的重點(diǎn)在于，清楚聽清哪個(gè)用戶在講是什么。所以麥克風(fēng)陣列、近場(chǎng)遠(yuǎn)場(chǎng)的抗噪、聲紋識(shí)別講話的人的身份、ASR（語(yǔ)音轉(zhuǎn)文字），等等硬件軟件的技術(shù)就相應(yīng)出現(xiàn)，向著前面這個(gè)目標(biāo)不斷優(yōu)化。

“講人話”在這類應(yīng)用當(dāng)中，并不那么重要。通常任務(wù)的執(zhí)行，以結(jié)果進(jìn)行反饋，比如燈應(yīng)聲就亮了。而語(yǔ)言上的反饋，只是一個(gè)輔助作用，可有可無(wú)。

但是任務(wù)類的對(duì)話智能，往往不止是語(yǔ)音控制這樣一輪交互。如果一個(gè)用戶說(shuō)，“看看明天的機(jī)票”——這表達(dá)正常，但無(wú)法直接去執(zhí)行。因?yàn)槿鄙賵?zhí)行的必要信息：1）從哪里出發(fā)？和 2）去哪里？

如果我們希望AI Agent來(lái)執(zhí)行這個(gè)任務(wù)，一定要獲得這兩個(gè)信息。對(duì)于人來(lái)完成這個(gè)業(yè)務(wù)的話，要獲得信息，就得靠問(wèn)這個(gè)用戶問(wèn)題，來(lái)獲得信息。很多時(shí)候，這樣的問(wèn)題，還不止一個(gè)，也就意味著，要發(fā)起多輪對(duì)話。

對(duì)于AI而言，也是一樣的。

要知道 “去哪里” = Agent 問(wèn)用戶“你要去哪里？”

要知道 “從哪里出發(fā)” = Agent 問(wèn)用戶“你要從哪里出發(fā)呢？”

這就涉及到了對(duì)話語(yǔ)言的生成。

“?AI?如何講人話？”

決定“該說(shuō)什么話”，才是對(duì)話系統(tǒng)的核心——無(wú)論是硅基的還是碳基的智能。但是深度學(xué)習(xí)在這個(gè)版塊，并沒(méi)有起到什么作用。

在當(dāng)前，處理“該說(shuō)什么”這個(gè)問(wèn)題，主流的做法是由所謂“對(duì)話管理”系統(tǒng)決定的。

盡管每一個(gè)對(duì)話系統(tǒng)背后的“對(duì)話管理”機(jī)制都不同，每家都有各種理解、各種設(shè)計(jì)，但是萬(wàn)變不離其宗——目前所有任務(wù)類對(duì)話系統(tǒng)，無(wú)論是前段時(shí)間的Google duplex，還是智能客服，或者智能助理，最核心的對(duì)話管理方法，有且僅有一個(gè)：“填槽”，即Slot filling。

如果你并不懂技術(shù)，但是又要迅速知道一家做對(duì)話AI的水平如何，到底有沒(méi)有黑科技(比如剛剛開始看AI領(lǐng)域的做投資的朋友 )，你只需要問(wèn)他一個(gè)問(wèn)題：“是不是填槽？”

如果他們（誠(chéng)實(shí)地）回答“是”，那你就可以放下心來(lái)，黑科技尚未出現(xiàn)。接下來(lái)，能討論的范圍，無(wú)非都是產(chǎn)品設(shè)計(jì)、工程實(shí)現(xiàn)、如何解決體驗(yàn)和規(guī)模化的困境，這類的問(wèn)題?；旧显撝钦系?，還是會(huì)智障。

要是他們回答“不是填槽”，而且產(chǎn)品的效果還很好，那么就有意思了，值得研究，或者請(qǐng)速速聯(lián)系我：）

那么這個(gè)“填槽”究竟是個(gè)什么鬼？嗯，不搞開發(fā)的大家可以簡(jiǎn)單的把它理解為“填表”：好比你要去銀行辦個(gè)業(yè)務(wù)，先要填一張表。

如果這張表上的空沒(méi)有填完，柜臺(tái)小姐姐就不給你辦。她會(huì)紅筆給你圈出來(lái)：“必須要填的空是這些，別的你都可以不管。” 你全部填好了，再遞給小姐姐，她就去給你辦理業(yè)務(wù)了。

還記得剛剛那個(gè)機(jī)票的例子么？用戶說(shuō)“看看明天的機(jī)票”，要想執(zhí)行“查機(jī)票”，就得做以下的步奏，還要按順序來(lái)：?

1. ASR：把用戶的語(yǔ)音，轉(zhuǎn)化成文字。

2. NLU語(yǔ)義識(shí)別：識(shí)別上面的文字，屬于（之前設(shè)定好的）哪一個(gè)意圖，在這里就是“訂機(jī)票”；然后，提取文字里面的實(shí)體，“明天”作為訂票日期，被提取出來(lái)啦。

3. 填表：這個(gè)意圖是訂機(jī)票，那么就選“訂機(jī)票”這張表來(lái)填；這表里有三個(gè)空，時(shí)間那個(gè)空里，就放進(jìn)“明天”。

（這個(gè)時(shí)候，表里的3個(gè)必填項(xiàng)，還差兩個(gè)：“出發(fā)地”和“到達(dá)地”）

4. 開始跑之前編好的程序：如果差“出發(fā)地”，就回“從哪里走啊？”；如果差“目的地”，就回“你要去哪里？”（NLG上打引號(hào)，是因?yàn)椴⒉皇钦嬲饬x上的自然語(yǔ)言生成，而是套用的對(duì)話模版）

5. TTS：把回復(fù)文本，合成為語(yǔ)音，播放出去

在上面這個(gè)過(guò)程當(dāng)中，1和2步奏都是用深度學(xué)習(xí)來(lái)做識(shí)別。如果這個(gè)環(huán)節(jié)出現(xiàn)問(wèn)題，后面就會(huì)連續(xù)出錯(cuò)。

循環(huán)1-5這個(gè)過(guò)程，只要表里還有空要填，就不斷問(wèn)用戶，直到所有的必填項(xiàng)都被填完。于是，表就可以提交小姐姐（后端處理）了。

后端看了要查的條件，返回滿足這些條件的機(jī)票情況。Agent再把查詢結(jié)果用之前設(shè)計(jì)好的回復(fù)模板發(fā)回給用戶。

順便說(shuō)一下，我們經(jīng)常聽到有些人說(shuō)“我們的多輪對(duì)話可以支持xx輪，最多的時(shí)候有用戶能說(shuō)xx輪”?，F(xiàn)在大家知道，在任務(wù)類對(duì)話系統(tǒng)里，“輪數(shù)的產(chǎn)生”是由填表的次數(shù)決定的，那么這種用“輪數(shù)多少”來(lái)衡量產(chǎn)品水平的方法，在這個(gè)任務(wù)類對(duì)話里里完全無(wú)意義。

一定要有意義，也應(yīng)該是：在達(dá)到目的、且不影響體驗(yàn)的前提下，輪數(shù)越少越好。

在當(dāng)前，只要做任務(wù)類的多輪對(duì)話，基本跑不掉填表。

5月的時(shí)候，Google I/O發(fā)布了Duplex的錄音Demo，場(chǎng)景是Google Assistant代替用戶打電話去訂餐廳，和店員溝通，幫助用戶預(yù)定位子。值得注意，這并不是Live demo。

Google's Assistant. CREDIT:GOOGLE

Google I/O 2018 Google Duplex Restaurant Call

那Google的智能助理（后稱IPA）又怎么知道用戶的具體需求呢？跑不掉的是，用戶還得給Google Assistant填一張表，用對(duì)話來(lái)交代自己的具體需求，比如下面這樣：?

圖中左邊是一個(gè)使用Google Assistant訂餐廳的真實(shí)案例，來(lái)自The Verge。

“?當(dāng)前對(duì)話系統(tǒng)的局限?”

我剛剛花了兩千來(lái)個(gè)字來(lái)說(shuō)明對(duì)話系統(tǒng)的通用思路。接下來(lái)，要指出這個(gè)做法的問(wèn)題

還記得之前提到的 “不要日本菜”測(cè)試么？我們把這個(gè)測(cè)試套用在“訂機(jī)票”這個(gè)場(chǎng)景上，試試看：“看看明天去北京的航班，東航以外的都可以”，還是按步奏來(lái)：

1. ASR語(yǔ)音轉(zhuǎn)文字，沒(méi)啥問(wèn)題；

2. 語(yǔ)義識(shí)別，貌似有點(diǎn)問(wèn)題

- 意圖：是訂機(jī)票，沒(méi)錯(cuò)；

- 實(shí)體提?。焊暗挠?xùn)練來(lái)；

? ? - 時(shí)間：明天

? ? - 目的地：北京

? ? - 出發(fā)地：這個(gè)用戶沒(méi)說(shuō)，一會(huì)得問(wèn)問(wèn)他...

等等，他說(shuō)的這個(gè)“東航以外的都可以”，指的是啥？之前沒(méi)有訓(xùn)練過(guò)與航空公司相關(guān)的表達(dá)啊。

沒(méi)關(guān)系，咱們可以把這個(gè)表達(dá)的訓(xùn)練加上去：東航 = 航司。多找些表達(dá)，只要用戶說(shuō)了各個(gè)航空公司的名字的，都訓(xùn)練成航司這個(gè)實(shí)體好啦。

另外，咱們還可以在填表的框里，添加一個(gè)航司選擇，就像這樣（黃色部分）：

（嗯，好多做TO B的團(tuán)隊(duì)，都是掉在這個(gè)“在后面可以加上去”的坑里。）

但是，這么理所當(dāng)然的訓(xùn)練之后，實(shí)體提取出來(lái)的航司卻是“東航”——而用戶說(shuō)的是 “東航以外的”，這又指的哪個(gè)（些）航司呢？

“要不，咱們做點(diǎn)Trick把‘以外’這樣的邏輯單獨(dú)拿出來(lái)手工處理掉？”——如果這個(gè)問(wèn)題可以這么容易處理掉，你覺(jué)得Siri等一干貨色還會(huì)是現(xiàn)在這個(gè)樣子？難度不在于“以外”提取不出來(lái)，而是在處理“這個(gè)以外，是指哪個(gè)實(shí)體以外？

當(dāng)前基于深度學(xué)習(xí)的NLU在“實(shí)體提取”這個(gè)技術(shù)上，就只能提取“實(shí)體”。

而人能夠理解，在這個(gè)情況下，用戶是指的“排除掉東航以外的其他選擇”，這是因?yàn)槿顺俗觥皩?shí)體提取”以外，還根據(jù)所處語(yǔ)境，做了一個(gè)對(duì)邏輯的識(shí)別：“xx以外”。然后，自動(dòng)執(zhí)行了這個(gè)邏輯的處理，即推理，去進(jìn)一步理解，對(duì)方真正指的是什么（即指代）。

而這個(gè)邏輯推理的過(guò)程，并不存在于之前設(shè)計(jì)好的步奏（從1到5）里。

更麻煩的是，邏輯的出現(xiàn)，不僅僅影響“實(shí)體”，還影響“意圖”：

“hi Siri，別推薦餐廳”——它還是會(huì)給你推薦餐廳；

“hi Siri，除了推薦餐廳，你還能推薦什么？”——它還是會(huì)給你推薦餐廳。?

中文英文都是一樣的；Google assistant也是一樣的。

想要處理這個(gè)問(wèn)題，不僅僅是要識(shí)別出“邏輯”；還要正確判斷出，這個(gè)邏輯是套用在哪個(gè)實(shí)體，或者是不是直接套用在某一個(gè)意圖上。這個(gè)判斷如何做？用什么做？都不在當(dāng)前SLU的范圍內(nèi)。

對(duì)這些問(wèn)題的處理，如果是集中在一些比較封閉的場(chǎng)景下，還可以解決個(gè)七七八八。但是，如果想要從根本上、泛化的處理，希望一次處理就解決所有場(chǎng)景的問(wèn)題，到目前都無(wú)解。在這方面，Siri是這樣，Google Assistant也是這樣，任意一家，都是這樣。

為啥說(shuō)無(wú)解？我們來(lái)看看測(cè)試。

“?用圖靈測(cè)試來(lái)測(cè)對(duì)話系統(tǒng)沒(méi)用?”

一說(shuō)到對(duì)人工智能進(jìn)行測(cè)試，大部分人的第一反應(yīng)是圖靈測(cè)試。

5月Google I/O大會(huì)的那段時(shí)間，我們團(tuán)隊(duì)正在服務(wù)一家全球100強(qiáng)企業(yè)，為他們規(guī)劃基于AI Agent的服務(wù)。

在發(fā)布會(huì)的第二天，我收到這家客戶的Tech Office的好心提醒：Google這個(gè)像真人一樣的黑科技，會(huì)不會(huì)顛覆現(xiàn)有的技術(shù)方案？我的回答是并不會(huì)。

話說(shuō)Google Duplex在發(fā)布會(huì)上的demo確實(shí)讓人印象深刻，而且大部分看了Demo的人，都分辨不出打電話去做預(yù)定的是不是真人。

“這個(gè)效果在某種意義上，算是通過(guò)了圖靈測(cè)試?！?

Google母公司的Chairman說(shuō)google duplex可以算過(guò)了圖靈測(cè)試了

由于圖靈測(cè)試的本質(zhì)是“欺騙”?(A game of deception，詳見Toby Walsh的論文)，所以很多人批評(píng)它，這只能用來(lái)測(cè)試人有多好騙，而不是用來(lái)測(cè)智能的。在這一點(diǎn)上，我們?cè)诤笪腜art 4對(duì)話的本質(zhì)中會(huì)有更多解釋。

人們被這個(gè)Demo騙到的主要原因，是因?yàn)楹铣傻恼Z(yǔ)音非常像真人。

這確實(shí)是Duplex最牛的地方：語(yǔ)音合成。不得不承認(rèn)，包括語(yǔ)氣、音調(diào)等等模擬人聲的效果，確實(shí)是讓人嘆為觀止。只是，單就在語(yǔ)音合成方面，就算是做到極致，在本質(zhì)上就是一只鸚鵡——最多可以騙騙Alexa（所以你看活體識(shí)別有多么重要）。

只是，Google演示的這個(gè)對(duì)話系統(tǒng)，一樣處理不了邏輯推理、指代這類的問(wèn)題。這意味著，就它算能過(guò)圖靈測(cè)試，也過(guò)不了Winograd Schema Challenge測(cè)試。

相比圖靈測(cè)試，這個(gè)測(cè)試是直擊深度學(xué)習(xí)的要害。當(dāng)人類對(duì)句子進(jìn)行語(yǔ)法分析時(shí)，會(huì)用真實(shí)世界的知識(shí)來(lái)理解指代的對(duì)象。這個(gè)測(cè)試的目標(biāo)，就是測(cè)試目前深度學(xué)習(xí)欠缺的常識(shí)推理能力。

如果我們用Winograd Schema Challenge的方法，來(lái)測(cè)試AI在“餐廳推薦”這個(gè)場(chǎng)景里的水平，題目會(huì)是類似這樣的：

A. “四川火鍋比日料更好，因?yàn)樗芾薄?/p>
B. “四川火鍋比日料更好，因?yàn)樗焕薄?/p>

AI需要能準(zhǔn)確指出：在A句里，“它”指的是四川火鍋；而在B句里，“它”指的則是日料。

還記得在本文Part 1里提到的那個(gè)“不要日本菜測(cè)試”么？我真的不是在強(qiáng)調(diào)“回字有四種寫法”——這個(gè)測(cè)試的本質(zhì)，是測(cè)試對(duì)話系統(tǒng)能不能使用簡(jiǎn)單邏輯來(lái)做推理（指代的是什么）。

而在Winograd Schema Challenge中，則是用世界知識(shí)（包括常識(shí)）來(lái)做推理：

如果系統(tǒng)不知道相應(yīng)的常識(shí)（四川火鍋是辣的；日料是不辣的），就沒(méi)有推理的基礎(chǔ)。更不用說(shuō)推理還需要被準(zhǔn)確地執(zhí)行。

有人說(shuō)，我們可以通過(guò)上下文處理來(lái)解決這個(gè)問(wèn)題。不好意思，上面這個(gè)常識(shí)根本就沒(méi)有出現(xiàn)在整個(gè)對(duì)話當(dāng)中。不在“上文”里面，又如何處理？

對(duì)于這個(gè)部分的詳細(xì)解釋，請(qǐng)看下一章（Part 3 對(duì)話的本質(zhì)）。

盡管指代問(wèn)題和邏輯問(wèn)題，看上去，在應(yīng)用方面已經(jīng)足夠致命了；但這些也只是深度學(xué)習(xí)表現(xiàn)出來(lái)的諸多局限性中的一部分。

哪怕更進(jìn)一步，再過(guò)一段時(shí)間，有一家AI在Winograd Schema Challenge拿了100%的正確率，我們也不能期望它在自然語(yǔ)言處理中的表現(xiàn)如同人一樣，因?yàn)檫€有更嚴(yán)重和更本質(zhì)的問(wèn)題在后面等著。

“?對(duì)話系統(tǒng)更大的挑戰(zhàn)不是NLU?”

我們來(lái)看問(wèn)題表現(xiàn)在什么地方。

現(xiàn)在我們知道了，當(dāng)人跟現(xiàn)在的AI對(duì)話的時(shí)候，AI能識(shí)別你說(shuō)的話，是靠深度學(xué)習(xí)對(duì)你說(shuō)出的自然語(yǔ)言進(jìn)行分類，歸于設(shè)定好的意圖，并找出來(lái)文本中有哪些實(shí)體。

而AI什么時(shí)候回答你，什么時(shí)候反問(wèn)你，基本都取決于背后的“對(duì)話管理”系統(tǒng)里面的各種表上還有啥必填項(xiàng)沒(méi)有填完。而問(wèn)你的話，則是由產(chǎn)品經(jīng)理和代碼小哥一起手動(dòng)完成的。

那么，這張表是誰(shuí)做的？

或者說(shuō)，是誰(shuí)決定，對(duì)于“訂機(jī)票”這件事，要考慮哪些方面？要獲得哪些信息？需要問(wèn)哪些問(wèn)題？機(jī)器又是怎么知道的？

是人。是產(chǎn)品經(jīng)理，準(zhǔn)確點(diǎn)說(shuō)。

就像剛才的“訂機(jī)票”的案例，當(dāng)用戶問(wèn)到“航司”的時(shí)候，之前的表里并沒(méi)有設(shè)計(jì)這個(gè)概念，AI就無(wú)法處理了。

要讓AI能處理這樣的新條件，得在“訂機(jī)票”這張表上，新增加“航空公司”一欄（黃色部分）。而這個(gè)過(guò)程，都得人為手動(dòng)完成：產(chǎn)品經(jīng)理設(shè)計(jì)好后，工程師編程完成這張表的編程。

所以AI并不是真的，通過(guò)案例學(xué)習(xí)就自動(dòng)理解了“訂機(jī)票”這件事情，包含了哪些因素。只要這個(gè)表還是由人來(lái)設(shè)計(jì)和編程實(shí)現(xiàn)的，在產(chǎn)品層面，一旦用戶稍微談及到表以外的內(nèi)容，智障的情況就自然出現(xiàn)了。

因此，當(dāng)Google duplex出現(xiàn)的時(shí)候，我并不那么關(guān)心 Google duplex發(fā)音和停頓有多像一個(gè)人——實(shí)際上，當(dāng)我觀察任意一個(gè)對(duì)話系統(tǒng)的時(shí)候，我都只關(guān)心1個(gè)問(wèn)題：

“是誰(shuí)設(shè)計(jì)的那張表：人，還是AI？”

只是，深度學(xué)習(xí)在對(duì)話系統(tǒng)里面，能做的只是識(shí)別用戶講出的那句話那部分——嚴(yán)格依照被人為訓(xùn)練的那樣（監(jiān)督學(xué)習(xí)）。至于其他方面，比如該講什么話？該在什么時(shí)候講話？它都無(wú)能為力。

但是真正人們?cè)趯?duì)話時(shí)的過(guò)程，卻不是上面提到的對(duì)話系統(tǒng)這么設(shè)計(jì)的，而且相差十萬(wàn)八千里。人的對(duì)話，又是怎么開展的？這個(gè)差異究竟在哪里？為什么差異那么大？所謂深度學(xué)習(xí)很難搞定的地方，是人怎么搞定的呢？畢竟在這個(gè)星球上，我們自身就是70億個(gè)完美的自然語(yǔ)言處理系統(tǒng)呢。

我們需要了解要解決的問(wèn)題，才可能開展解決問(wèn)題的工作。在對(duì)話領(lǐng)域，我們需要知道人們對(duì)話的本質(zhì)是什么。下一章比較燒腦，我們將討論“思維”這件事情，是如何主導(dǎo)人們的對(duì)話的。

關(guān)于作者

作者M(jìn)ingke，正在從事對(duì)話智能方面的創(chuàng)業(yè)，為世界一百?gòu)?qiáng)企業(yè)提供對(duì)話智能應(yīng)用的咨詢和解決方案。上次《為什么現(xiàn)在的人工智能助理都像人工智障》一文發(fā)出來(lái)之后，認(rèn)識(shí)結(jié)交了不少行業(yè)內(nèi)的朋友。希望這次，把過(guò)去一段時(shí)間的思考與大家分享，能給行業(yè)內(nèi)的新老朋友們一些啟發(fā)，有興趣溝通和碰撞的也歡迎與我聯(lián)系。

歡迎行業(yè)里的新老朋友勾搭吐槽，微信：mingke27 （請(qǐng)注明稱呼+所在機(jī)構(gòu)）

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

人工智障 2：你所看到的AI和智能無(wú)關(guān)（上）

人工智障 2：你所看到的AI和智能無(wú)關(guān)（上）

前言

閱讀門檻?

關(guān)于“人工智障”四個(gè)字

Part 1?

對(duì)話智能的表現(xiàn)：智障

Part 2

當(dāng)前對(duì)話系統(tǒng)的本質(zhì)：填表

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

人工智障 2：你所看到的AI和智能無(wú)關(guān)（上）

前言

閱讀門檻?

關(guān)于“人工智障”四個(gè)字

Part 1?

對(duì)話智能的表現(xiàn)：智障

Part 2

當(dāng)前對(duì)話系統(tǒng)的本質(zhì)：填表

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av