這是 4 月做的一次分享。大概是我做過的分享中,現場討論氣氛最熱烈的一次了。

為什么分享這個話題呢?
我做了好多年交互設計的工作,所以學習和工作一直有一個離不開的主題——人機交互(Human-Computer Interaction)。
人機關系的演進
什么是人機交互?我把它簡單理解為:
人如何與機器或是某個復雜系統的溝通和互動過程。
更為完整的版本,請看我在知乎上的回答 什么是交互設計?
比如,鼠標就是一個解決人和機器互動問題的經典產品。

現在大家都覺得鼠標再平常不過了,但是在當年,Douglas Engelbart 的這一項發(fā)明,極好地解決了人們在圖形化計算機界面操縱屏幕元素的問題。為了表彰這項發(fā)明以及在人機交互領域的開拓式貢獻,Douglas Engelbart 在 1997 年獲得了「計算機界的諾貝爾獎」——圖靈獎。
For an inspiring vision of the future of interactive computing and the invention of key technologies to help realize this vision. -- Turing Award Citation
人和機器的對話、交互一直在演進。這也從一個側面反映了人創(chuàng)造工具的歷史:

人創(chuàng)造的工具越來越多樣、復雜、強大。想想看,今天我們在手機上能完成多少事情。
于是,有人慢慢感到這種發(fā)展速度似乎不大對勁……奇點要來了,AlphaGo 也出現了。

隨著深度學習熱潮的演進,大家發(fā)現,以前為了讓機器智能化而不得不做的很多工作,比如,符號化、標準化、模塊化、輸入大量專家知識、需要龐大的訓練數據集、要做苦臟累的特征工程等等,現在都簡化了?;旧?,只要目標足夠清晰、可操作,訓練數據和計算資源足夠,機器學習產生的結果就可以滿足要求。
我個人也經歷了一次切身的體驗。
今年年初在上 Udacity 的 Deep Learning Nano Degree 課程的時候,最后一個實踐項目,是基于人臉圖像庫,用生成對抗網絡(GAN)算法自動生成人臉。
雖然在學習過程中,早已對算法能實現的結果有所預期。但是當我把程序放到 AWS 的 GPU 上面跑了不到二十分鐘,看到結果時還是忍不住隱隱感到機器的強大和壓迫。
這是最開始幾個訓練迭代生成的模糊不清的輪廓:

這是十幾分鐘訓練結束后生成的人臉:

說一點兒都不焦慮是假的。
何況各種媒體還鋪天蓋地強化這種焦慮,今天是一百零八種會被機器取代的工作,明天是哪個比賽機器又戰(zhàn)勝了人……
于是大家經不住會問:

似乎只有像詩詞、小說、爵士樂、即興表演這些領域,機器看起來就是不太擅長。
但,也不好說。
Paul 是一個專門給人畫肖像畫的機器。從 2011 年至今已經創(chuàng)做了非常多的作品??雌饋矸浅S兴囆g感,不是嗎?


有時候在焦慮之余,又忍不住會想:這種焦慮到底從何而來?
如果看過萊考夫「我們賴以生存的隱喻」的同學都知道,隱喻 Metaphor 對我們的影響有多么大。仔細想想,感到機器的威脅,是不是也源于人機關系的一些基本隱喻?
我們基本上都是以一種對立或一分為二的方式來看待這些基本詞匯:

看到這些詞匯,我們會下意識地覺得它們是對立關系。邏輯、精確、冰冷的工程思維,怎么跟想象、感性、個性、創(chuàng)作融為一爐呢?
這大概就是問題所在了。
隱喻和可能
語言有邊界。這是語言能高效傳遞信息的代價之一。
所以,打破語言或者說概念的界限,也許就是找到新出路的起點。
(PS. 在心理咨詢中,咨詢師很重要的一部分工作,是幫助來訪者呈現問題、reframe 問題,而不是直接插手去替他解決問題。)
其實早在 50 多年前,就有人探討過人機關系的「未來簡史」。
美國心理學家和計算機科學家 Licklider 在 Man-Computer Symbiosis 這篇論文中,討論人跟機器的關系存在什么樣的可能性,提出「人機共生」的概念。

快 60 年過去了,技術的發(fā)展讓「蠢機器」第一次有可能成為人類的「好基友」,我們?yōu)槭裁词紫雀械降氖墙箲]而不是興奮呢?
還記得 2016 年,在 AlphaGo 戰(zhàn)勝李世石后,跟安豬老師在大理有過一次討論。當時我的感慨是,為 AlphaGo 的勝利感到挺開心的,但并不是因為我是技術的腦殘粉,而是因為我覺得到了這個時候,人不得不去面對這樣一個問題:
人到底擅長什么?
也就是說,當接受生物智能無法跟上非生物智能的發(fā)展時:

人到底有哪些可以讓機器「羨慕」(當然,機器不會有這種情緒)的天賦呢?
至今我還沒有答案,但我想,大概會包括:直覺、洞察力、探索和意外的創(chuàng)造。人欣賞「意外」的審美、運用「意外」的創(chuàng)造力,應該會長期秒殺機器。
人跟機器最大的區(qū)別到底是什么?
我一直在問自己這個問題。

意圖,可能是現階段人跟機器最大的差別。
人因為時間、空間、認知方面的三大局限,因為生命時長極其有限、可觸達的空間極其有限、工作記憶(內存)極其有限,決定了人類的一些基本 drive 和價值觀。人的美妙與荒謬,可能都來自于兩行二選一的核心代碼:
Be numb/sober and Duplicate
Be insane/self-distroying and Love
所以我(naive地)認為,突破時間、空間、認知限制,渴望無限,是人類物種永恒的追求,換一個詞來概括,那就是——意圖。
我們在基本意圖上發(fā)展出復雜的能力,會體會微妙的情感,會追求意義,會審美、表達、共情,會講故事和構建社會關系……
而機器,無所不能,但就是沒有意圖!
這樣看來,現在難道不是人類最好的時代嗎?有一個毫無私心、任勞任怨、潛力無限的助手,為什么我們擔心的是被助手取代,而不是興高采烈地放開手腳去創(chuàng)造呢?
人機關系的新階段
無論技術如何發(fā)展,人類從來沒有停止過創(chuàng)造。
這是用 Google DeepDream 算法生成的作品:

DeepDream 網站的首頁,已經為人機關系的新時代做了注腳:

藝術家們一直在嘗試探索人機關系,可能是這樣的:

也可能是這樣的:

上圖是一位叫做 Dragan iLiC 藝術家的項目,人充當機器的筆刷,由機械臂控制著人去作畫。
在分享的現場,這張圖引發(fā)了熱烈的討論。有的小伙伴表示,這樣做的目的到底是什么,她看不出任何意義。有的小伙伴認為這是對人機關系一種悲觀的表達。有的小伙伴的態(tài)度則更為中立而開放……
我想,這恰恰就是藝術家的目的吧:激發(fā)人們的反思與討論。并不存在對與錯,只是 raise questions,這也許就是最大的善意。
音樂,人機協同即將爆發(fā)的領域?
最近關注音樂和技術結合的領域比較多,越來越覺得音樂也許會迎來人機共創(chuàng)的繁榮時期。
音樂本身是符號化、形式化非常強的「語言」。音樂的規(guī)律經過數百年的研究和沉淀,幾乎已經沒有太多規(guī)律上的「未知和秘密」,更多的變化會來自文化思潮影響下的風格探索。
算法作曲早已不是什么新鮮事,基于 AI 自動生成音樂已經有很多成熟的應用。甚至是在對即興表演要求相當高的爵士樂,也已經有人機共同即興表演的嘗試。比如 Al Biles 教授的 GenJam 項目,從 2005 年至今,已經演出過數十場。
<iframe frameborder="0" width="640" height="498" src="https://v.qq.com/iframe/player.html?vid=z0712pdmu7n&tiny=0&auto=0" allowfullscreen></iframe>
而去年的 Qosmo AI DJ 項目也展示了人類 DJ 和 AI DJ 一起 Jam 的效果~
<iframe frameborder="0" width="640" height="498" src="https://v.qq.com/iframe/player.html?vid=t0602v8uxp2&tiny=0&auto=0" allowfullscreen></iframe>
AI DJ Project 人工智能 DJ 與人類合作打碟_騰訊視頻
何以解憂?
這是最壞的時代
也是最好的時代
這取決于我們現在每做的一個決定、每投入的分分秒秒。
回到主題,如何破解 AI 時代的焦慮呢?
以下是 00 給(自己)的解藥:




回歸創(chuàng)造者的使命,裝備上創(chuàng)造所需要的心、眼、腦、手,去看去愛去體驗。知識可以學習,但智慧更多是一種體驗。把技術當成伙伴和切磋的對手,去行動,去試驗,去創(chuàng)造。
最后

Ref
- Doug Engelbart 1968 Demo
- PATRICK TRESSET |
- Licklider - Man-Computer Symbiosis.pdf
- www.draganilic.org
- GenJam
00 的文集
