到底是誰更靠譜?黑科技漫談(6)——機器與人的誤會

前文提到機器未來在有確定答案的事情上可以戰(zhàn)勝人類,并不等于把人類說得一無是處。相反,人機配合才能有更好的效率和輸出。在今天,即便大多數(shù)的工業(yè)化生產(chǎn)線實現(xiàn)了流水作業(yè),但多少仍雇傭一些工人:而這些工人其實是操作機器的高手,同時也是生產(chǎn)線上把控質(zhì)量的第一道關(guān)。倘若機器出現(xiàn)誤操作,要靠人及時介入,調(diào)整規(guī)格或者終止機器,否則機器將源源不斷地生產(chǎn)廢品。

在人機互動中,機器能理解人類的指令,并不是先天的,而是經(jīng)過人不斷地訓(xùn)練和調(diào)試。大多數(shù)的機器是一個系統(tǒng),輸入一個種子之后,就會產(chǎn)生固定的輸出結(jié)果。比如把大米丟進電飯鍋,會出來米飯;把衣服丟進洗衣機,出來會是干凈的衣服。但機器本身并沒有太多的判斷能力:比如洗衣機即不會判斷你的衣服是臟還是干凈,也不會判斷你的衣服是織物還是羊毛應(yīng)該用什么力氣洗——一切都來自人類的經(jīng)驗。稍微智能一些的機器會輸出不同的規(guī)格:比如既可以做米飯,也可以做粥或者熬湯,但背后的原理,依然是給XX食材提供YY火候,還是由人類通過自己的經(jīng)驗,去進行這些設(shè)定與挑戰(zhàn)。機器只是加速了實現(xiàn)的途徑,減輕了人的負擔(dān),又回到了之前的那句話:凡事若是重復(fù)三遍以上,就該有自動化過程。

除此以外,另一個接受信息的維度是信息的變化和復(fù)雜度:即在這一個輸入的問題中,有多少種可能的變化:最早的輸入是物理按鍵,比如計算器上的數(shù)字鍵或者是ATM取款機上的密碼鍵,這種情況下其實機器接受輸入只有兩種結(jié)果:按了還是沒按。比如按下數(shù)字1,就會被接收到,并反映成為1的功能;按下數(shù)字0則是另一種變化…… 在有限的組合中,機器從來不犯錯誤,我們從未見過計算器的計算結(jié)果不對,抑或是ATM把你的賬戶余額算錯等等。這種靠譜的表現(xiàn)也被應(yīng)用到了一些高風(fēng)險的日常生活中,比如汽車:按喇叭就一定會響,按雙閃按鍵一定會亮燈,所有的操作都給人以安全感,讓人可以放下心來。

但是隨著機器的智能化,有限的輸入將不再能滿足人們的需要了,貪婪的人類認為需要滿足更多的需求才好。于是除了電腦鍵盤,鼠標被發(fā)明了:你可以點擊屏幕的任何地方(可能是幾百或幾千萬像素);功能手機演進到了智能手機:無需按鍵,屏幕的任何地方都可以作為指令。這還不算,現(xiàn)在更出現(xiàn)了語音輸入方式,無論是快速創(chuàng)作,還是調(diào)戲Siri,大家都樂此不疲。

人類的生活就是在數(shù)以億計的可能性下幾乎無限的組合。這種無限輸入,其實正是我們生活中的真實體現(xiàn)。比如每個人可能每年走不了多少不認識的路,因此用導(dǎo)航的時間屈指可數(shù);但是互聯(lián)網(wǎng)把所有需要用地圖導(dǎo)航的人都放在了一起,這就形成了海量的需求。一個極端的例子,還有翻譯軟件。除了以外語為職業(yè)的人之外,日常人們用到的翻譯機會其實少之又少:而且語言這種東西進化極慢:人年少時怎么說話的,年老了八成還是同樣的語言,不太會變化。在這種默認的場景下,自動化的翻譯就應(yīng)運而生:因為機器只要”學(xué)習(xí)一次“,便可以有終身記憶。但是人類的語言是千變?nèi)f化的,同一個字在不同環(huán)境下有不同的意思,不同的字組合起來,意義又會截然不同,即便機器攻克了上面這些困難,人類說的話還會因為斷句不同有不同的意思,比如下面這個:



如果較真,確實是有“你/好無聊”以及“你好/無聊”這兩種表達方式(如果深究還可能有更多種);人類通常傾向于第一種,但機器比較難理解這種語境背后的邏輯,在什么情況下是哪一種,于是形成了機器與人美麗的誤會。而有些時候,甚至完全顛倒了本來的意思,比如下面這個(之所以貼中文譯日語翻譯,是因為中譯英機器人做對了,沒有中招),即便在人類的語言中也可能會鬧出笑話,機器自然無法避免:



如果你發(fā)現(xiàn)過幾天這兩個翻譯軟件修改了上面的錯誤,請千萬不要吃驚,這只是龐大系統(tǒng)里的一個暫時未被發(fā)現(xiàn)的bug而已。對于程序員來說,一旦知道了問題在哪里,解決一點都不難。。

上面說的是機器誤會了人的意思,這也是無限輸入所面臨的終極問題。想定義一個原子集合,又把所有的操作變成原子集合的疊加,是一個理論上的可能,而在實現(xiàn)中無法達成:因為復(fù)雜問題中的維度太多,如果你需要確認每一個維度,最終人類會因為沒有耐心而放棄與機器交互,更傾向于找同類解決自己的問題。

一個例子,就是越來越普遍使用的自助語音服務(wù)系統(tǒng)。

想必你有這樣的經(jīng)歷:

“歡迎致電XX,普通話請按1,English service press 2”,我們選擇按1;

"國內(nèi)機票請按1,國內(nèi)酒店請按2,國際…… " 我們再選擇按1;

“機票預(yù)訂請按1,機票查詢請按2,退票請按3…… ”;

以上的各個問題,是不同維度的輸入請求(語言、服務(wù)、功能),每個問題幾乎被分解成了互斥又互補的幾個選項:比如聽中文就不能聽英文,機票服務(wù)和酒店也無法一起操作。但是毫無疑問,你如果用系統(tǒng)背后設(shè)計的機制去做一些復(fù)雜的服務(wù)比如改簽,機器并無法自然完成,流程會讓人抓狂。于是乎我們都期待這個菜單最后有個“人工服務(wù)請按0”。通常,令人更加失望的是,人工服務(wù)一般要等待好久,甚至干脆就沒人聽。

所以,話務(wù)員不用擔(dān)心失業(yè),需要你們的大有人在。一個真正完善的自動語音應(yīng)答系統(tǒng),應(yīng)該具備識別能處理的業(yè)務(wù)和不能處理的業(yè)務(wù)。能處理的自動處理,不能處理的轉(zhuǎn)為人工。

還是那句話,人機合作才是王道。



#413-Haomian-一齊聽棉講故事#+橙子學(xué)院碼字島第14篇作業(yè)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容