由于個人水平有限,這是初步構想,如果考慮不周或錯誤請見諒并告知。
有的人可能會覺得我這都是天方夜譚,有生之年根本不可能實現嘛,和我們的生活有什么關系呢?我要澄清一下,這些都是基于我自己對于世界科技的發(fā)展的了解和別人的預測得出的判斷,在我們的有生之年內,10到30年左右,是可以實現的。世界的長期預測是比短期預測要容易的,短期的歷史充滿了不確定性,但是長期的歷史是具有明顯的趨勢的。雖然不感確定預測的正確性,但個人認為80%的可能是有的,如果不出意外的話。所謂的意外就是一些世界性的大災難導致人類大幅度衰退。
摘要
本文介紹我理想的三個方面,這三個方面是循序漸進,互相依賴的。第一個方面是構建一個分布式、開放、人人可參與的人工智能數據庫,或者叫知識引擎,利用人工智能促進知識、技術、信息、資源的自由流動,促進人類文明的科技發(fā)展;第二個方面是基于該知識引擎的一套開放的經濟系統(tǒng),將給內容生產者們提供一個盈利的平臺,自動地給生產者分配報酬,讓人們可以專心生產內容,以促進知識引擎和人工智能的發(fā)展。第三個方面是為了盡量防止當人工智能強大以后造成的極端貧富差距,盡力維護一個公正的世界,防止人類文明的毀滅。
1.知識技術信息的自由流動
1.1.知識傳播的現狀
我們這個社會比起古代,信息傳播和知識的傳承進步了很多個數量級。一開始,世界上的信息只能通過生物的DNA來保存;后來,一些生物有了語言,等人類出現很久之后,出現了文字;幾十年前,出現了電腦和互聯網,有了搜索引擎,信息又進一步地能更快地傳播,而且,有了維基百科,有MOOC等提供免費優(yōu)質課程的網站等等。
1.2.對知識傳播的憧憬
現在雖然有了搜索引擎,找想要的信息一般都能搜索到,但是依然有很多不足。一方面,很多時候人并不知道自己心里想的那個東西的名字是什么,想著那個東西但是不知道怎么搜索;一方面,世界上有那么多種自然語言,不同語言之間的隔閡依然很大,而機器翻譯的效果也還有限;一方面,大量專業(yè)方面的知識即使是用一個人的母語寫成的,對于沒接觸過該領域的人來講往往也是天書一般。
要解決以上問題,夢想中的最佳方案需要一定的強人工智能,需要知識系統(tǒng)本身有智能,能夠真正理解搜索的詞語。Wolfram Alpha在我看來已經某種程度上能“理解”大家的問題了,但是實際上還并沒有真正地理解,Wolfram Alpha至今依然只有英語版本,真正的理解,應該是可以理解所有已知語言的,只要有人去教它。
Wolfram Alpha是我用來說明我的憧憬的一個例子,我理想中的==知識引擎==(暫時叫它知識引擎吧)應該滿足以下條件(包括但不限于):
- 能理解人打字的搜索或者語音的輸入
- 當輸入有歧義時,能主動詢問以消歧,換句話說,能像人一樣和客戶確認其需求
- 利用自然語言生成等,能自動的轉化結構化知識為自然語言,也能將外部學習到的自然語言知識自動收錄整合到內部的數據庫
- 內部有結構化的世界知識,不同于維基百科這樣以自然語言,更像維基數據(Wikidata)、Cyc等知識圖譜有關的本體及常識知識,是應該能將所有信息綜合在一起的“數據庫”,更像人腦中組織知識的形式,而不僅僅是這些形式化本體的這種形式。(具體后面討論)
1.3.一套知識引擎系統(tǒng)及其實現基礎的構想
要建立能包含一切知識的知識引擎系統(tǒng)(知識圖譜),我曾經以為通過圖論中節(jié)點連接的表示方法就能表示一切,后來發(fā)現還是想得太簡單了。這樣就不能表示連接之間的連接,即高階連接,實際知識中不僅有實體的屬性,屬性也有屬性……光用Wikidata等本體像圖論那樣展示知識是肯定不行。
1.3.1.知識引擎的理論基礎
要讓一個知識系統(tǒng)能表達所有可能的事物和概念,有沒有這個可能呢?沒有,這個問題和可計算理論的停機問題類似。最簡單的例子就是如何表達一些實數,π和e是最常見的無理數了,它們的精確表達是有無限位小數的,但是至少它們還可以用“π”和“e”這樣的符號表達,并且有其明確的定義,π的定義是“圓的周長與直徑的比值”,這個定義有10個字,這至少是有限的,但是其實還有無數的無理數,根本沒法定義,或者說,根本沒有有限長度的描述,其最短的定義可能就無限長,或者比自然數的無限還長了,這種定義就沒用了。因此有無限事物或概念,是無法精確描述和思考的,我們只能定義有一類概念是我們無法描述的,這個類可以描述成“我們無法描述的事物”,這個類的具體實例我是無法描述出來的,因為根本就不能描述嘛……
有無限的事物是不能描述的,但至少受限于知識的載體,知識的表現形式是有限的。這個有限是受制于文字的表達能力的,是受制于圖靈機的計算能力,所有圖靈等價的計算模型都一樣的。這個參見可計算性理論。
要表達所有知識,就相當于要對所有知識建模。要能表達像數學公理系統(tǒng)那樣精確的形式系統(tǒng),也要能表達如自然語言等的模糊系統(tǒng)。但是不同知識系統(tǒng)之間的結構差異是如此之大,想要將所有概念統(tǒng)一在一個體系中幾乎是不可能的。不過數學中有那么多的數學結構。數學作為純理論的學科,包含了所有可能的的結構,所有知識可能出現的結構,都早就在數學中被研究過了。比圖更高級的數學結構是拓撲空間,比集合更高級的數學結構是范疇論中的范疇。圖和集合都可以說是這些更高級結構的一般形態(tài)而已。在拓撲空間和范疇之上,還有更高維的拓撲空間和范疇結構,范疇有范疇的范疇……一直到∞-范疇。即使是這么復雜的數學結構,也不能作為世界上所有可能事物的模型,但是所有可能的知識和信息的結構是可以被這些結構描述的。更高級的數據結構是可以減少認知的成本的(僅用文字描述一個事物的能力是有限的,能用圖像描述事物就容易懂多了,如果給一個實際的物體放在人的面前就能更準確地認識事物,關鍵是表現形式更準確后讓人越容易吸收)。數據結構中圖、樹、鏈表等都是這些復雜結構的特例,當然越復雜的結構,其增刪改查的實現就越復雜,但我認為這是一定要跨過的坎。只用現存知識圖譜那樣的圖數據庫是不符合AI的發(fā)展方向的。終極的知識圖譜必須利用更加復雜的數學結構。
1.3.2.知識引擎的實現構想
但是即使有內存真的無限大的圖靈機也不能完美的模擬完整數學結構的所有細節(jié)(因為這比自然數大小的無限還大,本來就有很多本質不可計算的事物),現實世界中只能用有限的資源來模擬或思考無限的知識。這個只有有限資源的知識圖譜要怎么辦呢?馮諾依曼式構架的計算機和神經網絡組成的大腦這些有其固有結構的圖靈完備的機器如何擁有通用人工智能(AGI)呢?
我認為需要很多個系統(tǒng)的循環(huán)互相定義、模擬、計算。最簡單的理解就是,如果要定義或解釋一個詞A的意思,假如定義是B,那么就還應該定義B,如果B的定義是C,那么還要解釋C的意思(這好像也等價于Symbol Grounding Problem)……這樣最終總會遇到不能定義的情況,除非這些詞語之間互相定義了。這就像數學里的公理系統(tǒng),是由少數幾條公理推導出一整套的公理形式系統(tǒng),包括其中的定理、引理……其中的公理是不能被證明的,因為其是其它所有定理的基礎,被認為是不證自明的。但是要理解這些公理,是必須繼續(xù)給公理以解釋的。在這個形式系統(tǒng)中不能定義,那就只能用其它的形式系統(tǒng)了。所以,我認為唯一的方法,就是很多個不同的形式系統(tǒng),像環(huán)一樣互相定義了。當然滿足這個要求的最簡單的結構是環(huán),也可以是比環(huán)更復雜的結構,這些形式系統(tǒng)之間的更復雜關系本身就是一種拓撲結構了。這一串像環(huán)一樣的系統(tǒng)可能包括但不限于:數學中的集合論、范疇論、圖論、拓撲學、概率論……哲學中的本體論、知識論、形而上學、科學哲學、邏輯學……其它的交叉學科還有可計算性理論、信息論、語言學、心理學、認知科學、經濟學、博弈論等等??傊?,是可以至少用其中的兩個系統(tǒng)達到定義一切的,也可以是很多個系統(tǒng)互相定義,這都可以,最終是等價的。在這里我不給一個具體的方案了,工作量也不小??赡苡袆e人研究過,暫時沒去找。
通過以上形式化的定義,加上機器學習、深度學習、模式識別等方法,這就結合了人工智能的基于符號(邏輯)的精確推理系統(tǒng)和現在流行的統(tǒng)計學習方法?,F在卷積神經網絡(CNN)在圖像識別等特定任務上已經很成功了,但是這樣完全的端到端的訓練需要的代價還是太大了,需要的樣本也特別多,人(我們這種通用智能)之所以經常能在看別人做過一次某事的情況下,就能模仿做出相同的動作(One-shot learning)就是因為我們大腦中已經存在的足夠的知識,有那個知識體系就能快速得到答案,換言之能將訓練集可能幾百個維度(比如圖片像素)降維成只有一兩個維度(比如是否有圓、正方形),就像A星算法中的啟發(fā)一樣。描述地不精確但應該明白我的意思。用信息論也能解釋。
所以,應該盡量地將不同的系統(tǒng)整合起來,雖然這個不容易,但是這是必經之路。比如大家用ImageNet訓練出來的圖像識別的網絡,整合Google用大量語料訓練出來的Google翻譯網絡等等,再加上各種開源的知識圖譜。甚至,把這些訓練好的深度神經網絡本身當作訓練集,通過聚類等不管什么方法,得到神經網絡里面自身的一些結構模式、Pattern,比如pooling layer等layer這樣的結構作為Pattern識別出來,這些pattern和“pooling layer”這樣的文字對應上,就是一種飛躍啊。在這基礎上,如果能像人腦一樣相互連接的概念足夠多,就會產生質的飛躍。雖然這個看起來很難,不過強人工智能的實現恐怕必須得經過這一過程,連接一切。
如果實現,這個知識引擎就是一個全球大規(guī)模分布式人工智能+數據庫。等到這個整合了一切的網絡形成,或者大致形成,該知識引擎就應該可以自動地用自然語言等方式和人類對話,畢竟它本來就有關于自然語言等的知識。
1.3.3.知識引擎的應用接口
這個知識引擎的輸入輸出接口是個非常重要的部分,就像人與外界接觸的方式一樣,人有五種感覺,知識引擎與人交流的時候,也將使用并不止使用這五種感知的方式(眼耳口鼻舌……)。并且,這些用戶接口,比如GUI,甚至以后直接讓電腦連接人腦的神經元(腦機接口),就不應該像現在的大部分APP一樣,是設計師定好的界面,而應該是對用戶高度定制的,自動生成的,也就是說,通過對用戶的了解,自動生成一套最適合該用戶的界面,而且,可以隨著和用戶的廣泛交流,快速的馬上更改設定,更改界面。這種技術一開始需要太多的積累,一開始估計是完全不能用的狀態(tài),但是積累到一定程度后,就會有質的飛躍,突然變得可應用。
1.3.3.1.個性化教育與個性化學習路徑
當前的教育基本上還是規(guī)模式的,很大的班,整個班甚至整個國家使用同一套教材。但是從孔子開始就在提倡因材施教??墒?,畢竟由于成本問題,我們很難做到一個老師專門輔導一個學生。還是一個老師帶一個班的學生。即使是現在網上最新開始興起的MOOC等等公開課的視頻,也是事先直接錄制好的,雖然比大部分的老師講的好,但畢竟不是根據每個學生自己獨特的需要設計的課程內容。
但是最優(yōu)質的教育內容肯定是為個人準確定制的,而且,學習的內容的路徑本身,也是可以被定制,是有個學習的順序的。
所謂的學習的順序,比如概念的學習,是有個循序漸進的過程的,不同的概念或詞匯之間可以定義出來距離,這個距離可以是多種維度的,可以是語義的距離,可以是發(fā)音的距離,也可以是字形的距離。只要不同的概念之間有不管什么維度的相似之處,這個維度都可以用來定義概念或詞匯間的距離。
因此,有了這些概念之間距離的維度,就能通過算法得出學習一個領域的路徑。更進一步,可以讓人類和AI互相學習,得出如何學習路徑更好的方案。
1.3.4.知識引擎的一種界面設想
現在,知識和信息呈現給我們的樣子主要有這么幾種模式:文字、圖像、語音。對于數學還有公式,對于電腦來講還有程序的代碼。所有這些信息的形式都是所對應的知識的一種模型。但是,文字和語音是一維的;圖像,最多還有數學公式,算是二維的;代碼作為文字的一種形式表面上看是一維的,不過其結構基本上算是對所描述的東西的比較精確的模擬了,但其結構的維度也是很有限的。總之,我們用各種信息的載體來描述事物時,都是大大簡化了的,丟失了大量的信息,就好像降維一樣,本來3維世界中的一個物體可能有幾十維(種)屬性,當必須用文字這種一維的形式表達出來時(就像我現在用文字來描述我的想法一樣),文字就會很復雜,組織語言的結構就很難,好像總有更好的寫法,要么用形式語言描述的話(比如某種代碼),就得先定義好格式(不同的編程語言),這些不同的語言在描述一個物體是,就好像帶有偏見一樣,面向對象的就偏向用類和對象的方法思考物體,函數式語言就偏向用函數的方式思考物體……。給你一個錘子,就看什么都是釘子了。有十幾種編程范式:面向代理、基于組件、連續(xù)式、并發(fā)計算、聲明式、事件驅動、元編程……每一種范式就是一種模型,也是一種對事物的思維方式。但是每一種都只是看待事物的一個側面,要全面地認識一個物體理論也是不可能的事,只能盡可能地認識一個物體,并且盡量壓縮認識的成本。要盡可能地認識事物,還是需要用到盡量高級的數學結構,這樣更接近事物的本質,并且能減少認知的成本。所以,我對知識引擎界面的一種設想是,一種高度靈活的,可定制隨意變化的,盡量接近事物本身結構形式的一種界面。這樣描述不太容易懂,精確的如下:
//TODO
性質列表:
- 對知識內容盡量用最接近該內容的形式表達。比如地圖就是圖,故事就盡量是視頻甚至VR電影。
- 內容的可編輯。當發(fā)現錯誤時,應該能非常及時方便地改正。
- 內容的全面。一個主題的內容應該能盡量關聯所有有關的其它內容,并且按內容的結構組織好。
2.知識內容提供者的激勵與變現:一個開放的經濟系統(tǒng)構想
2.1.開放的經濟系統(tǒng)
這個經濟系統(tǒng)的目標,學術一點講,就是要實現有效市場(Efficient-market hypothesis)。對有效市場的定義是:如果在一個證券市場中,價格完全反映了所有可以獲得的信息,那么就稱這樣的市場為有效市場。
當今這個社會中,還充滿了信息不對稱,以及各種不平等(即使法律上都做不到平等),還有各種愚昧無知(有良好教育的人依然是少數)。有人利用行政壟斷獲取大量財富;有人靠欺騙和利用別人的心理,既傷害了別人又獲取了大量金錢(比如莆田醫(yī)院)。我們的社會還有太多的不公和不足……我們的知識產權系統(tǒng)也比起以前好多了,但是依然漏洞百出,一方面是正版資源高昂的費用;一方面是大量的盜版資源阻礙了創(chuàng)新能力;一方面還有專利流氓鉆知識產權法的空子;一方面我們的科研體系還依然官僚主義嚴重……當然,比起以前現在已經是有史以來最好的時代了。但是可以提升的空間依然非常巨大,制度作為一種技術將來也必將越來越完善。以后的社會還將更好,可能會真的實現共產主義(我的理解為,人人生活富足且充實安定),而其中應該會有一套知識的經濟系統(tǒng)。
這套經濟系統(tǒng)也是我以上知識引擎的輔助部分。一個強大的知識引擎中的內容必須是要盡量多的人貢獻才會發(fā)展地更快。維基百科是這個世界上最著名的大規(guī)模協作的產物,整個科研圈子也是大規(guī)模協作的產物,都是開源的開放的,但是有個缺點就是,沒有人能靠這個直接賺錢,還有大量的優(yōu)質內容,是必須必須付費獲得的,由于生產這些優(yōu)質內容的人需要靠這個盈利,即使是傳播的邊際效應如此低的今天,這些優(yōu)質的內容也很難大規(guī)模傳播。要讓更多的人貢獻更多優(yōu)質的內容,就不能全靠免費,如果能做成一個大家共贏的收費的平臺,才能最大規(guī)模地發(fā)展,就像蘋果發(fā)明的App Store一樣。
但是一個知識引擎能靠什么盈利呢?要把這個生態(tài)系統(tǒng)建設起來又有多難呢?我還并不明了。我只是認為需要一個更好的一套知識經濟系統(tǒng),而且這能促進知識引擎的發(fā)展,知識引擎的發(fā)展也能促進知識經濟系統(tǒng)的發(fā)展。但如果這個最終能發(fā)展起來,一定是世界上一個龐大的產業(yè)和基礎設施。
2.1.1.經濟系統(tǒng)的性質構想
這個經濟系統(tǒng)是依托以上知識引擎的一套自動地根據貢獻(比如生產知識)給予對應報酬的系統(tǒng)。比如這個系統(tǒng)應該能利用已有的知識自動地去生產產品產生財富,然后根據貢獻那些知識的人自動地分配財富。這個分配的算法本身,應該也是AI和人類一起商量運算出來的。這個經濟系統(tǒng)必須盡量地優(yōu)化人們的合作,減少人們合作和摩擦的成本,盡可能地提高人類的效率。
這套經濟系統(tǒng)將滿足以下性質:
- 信息開放:信息開放是達到有效市場的前提。即使有些信息是有價格的,也要盡量將信息的價格公開。
- 按勞/要素分配:按照每個人的實際貢獻分配資源。這個貢獻本身就很難衡量,但必須要有一套統(tǒng)一的計算方法。
- 貢獻測量:經濟系統(tǒng)必須作為一套基礎設施(AI)自動地衡量每個人的貢獻和成就,并公開信息和風險,并引導社會的投資發(fā)展方向,這樣,構建一個非常公平的社會環(huán)境。
- 減少不必要競爭,加強合作:該系統(tǒng)應該要能通過好的制度設計,減少人們之間的惡意競爭(零和博弈或負和博弈),引導人們進行雙贏的非零和博弈,盡量減少囚徒困境這種局勢的產生。
- 減少博弈、交流、談判成本:該系統(tǒng)要做到讓人足夠信任,以至于可以將自己的一部分談判權外包給系統(tǒng),讓系統(tǒng)安排自己的工作、生活,甚至是和別人的談判、博弈。讓人可以安心自己的工作。并能促進共產主義的實現(I'm serious!是有這個可能的)。
2.1.2.經濟系統(tǒng)的實現方式討論
該經濟系統(tǒng)和知識引擎一樣是分布式、公開的,由比特幣設計的區(qū)塊鏈技術是很有潛力的實現方式。
3.社會貧富差距和分配的優(yōu)化
即使是構建了一個==2.知識內容提供者的激勵與變現==中的有效市場,一個過程公平有序,有效的市場,最終這個世界也還是會有極大的收入不公平存在,這是為何呢?因為只要有資源是稀缺,這些稀缺的資源就將漲到極高的價格,就比如現在大城市的房價,北京、上海這樣的超級大城市聚集了幾千萬的人,這么多人的聚集實際上降低了每個人生活的邊際成本,大家吃飯、出行、工作等需要消耗的資源減少了,每個人互相交流的成本降低了,那大家的開銷應該減少才對吧?但是由于空間是稀缺的,房價漲到了幾萬一平米,抵消了大家生活成本的降低,大家的實際生活成本還是很高,只有比較早買房的人享受了最多經濟增長。稀缺的資源就像黑洞,最終,社會的財富在這個有效的市場中聚集到了少數掌握社會稀缺資源的人手中。并不是說占有資源的人道德低下,相反,在有效市場中能勝出而占有資源的人本身就是有能力的人,道德往往也比窮人更高,也更努力,就是這樣合法合理的所得,也會使得貧富差距擴大。在一個AI發(fā)展地足夠完善的市場中,將比現在更多地展現馬太效應,占有AI資源的人將全方面地提升自己每一個方面的能力,占有更多的資源,然后將更有能力獲取更多的資源,而沒有資源的人,比如現在的農民工,以后將連干體力活的被剝削的價值都沒有,因為AI的發(fā)展會使機器人的效率更高成本更低。AI的這種放大效應將使人類的貧富差距進一步呈指數級擴大,等到某一方勢力(可能是一個人)超越剩余所有勢力的能力總和時,甚至遠遠超越時,它就可以完全無視其它人,自己單獨地發(fā)展,也許它不會對其它人抱有惡意,但當能力超越其它所有人時,它是可能是完全無意地不小心就毀滅了其它所有人,因為其它人對它來講就像螞蟻對于我們一樣,不關心。
在我們的現在的社會中,政府的稅收、社會的福利是解決貧富差距的方式之一,不過不管是稅收還是福利也都是一種社會的制度,是制度就有被利用和操作的可能,現在的超大跨國公司就能利用各國之間法律的不同或者直接利用法律的漏洞,合法的大量避稅(很多跨國大型企業(yè)都在這么做),最終反而是中小企業(yè)承擔了更多的稅務。以后,一個公正的社會需要有一個高科技的立法機構設定制度,這個“高科技”是必須和同時期的AI所相匹配的。
考慮到公平和社會問題,以上2中經濟系統(tǒng)應該繼續(xù)滿足以下條件:
- 合理的稅收:稅收是實現社會資源再分配的一種重要手段。
- 按需分配:每個人的基本生活需要在有條件的情況下應該無條件滿足。至少讓每個人有基礎的保障。
- 幸福工程:社會制度應該也是一種科技,現在很多不遠的將來心理學和人類財富到一定程度后,將通過幸福工程盡量讓每個人即使在沒有很多財富的情況下都感到比較幸福的。
- 高科技的政府:人工智能應該全面應用進政府的運轉,作為政府機構的輔助,甚至可以在某些地方取代人類。
如果真的實施這樣的制度,這本身是實現不了帕雷托最優(yōu),一定會有很多高層的利益被損害。但是所有人的平均福利將會大大提高,一些高層的經濟利益可能被損害,但是本身感受到的幸福指數肯定會提升巨大(如果做不到那這制度也實現不了)。
總結
我的理想的核心就是一套輔助實現強人工智能的知識引擎,這不一定是要我自己實現,也不一定完全符合我的描述,很可能大家自然地發(fā)展出來一個這樣的系統(tǒng),名字也不叫知識引擎,這都不重要,重要的是這樣一個系統(tǒng)的發(fā)展,我只希望能盡量參與這樣一個事業(yè)中,促進和加快它的發(fā)展。當該知識引擎發(fā)展到一定規(guī)模,不可避免地將融入社會生活的方方面面,從經濟到政治,必將無處不在。所以,知識引擎必須深深地融入我們的經濟系統(tǒng)中,形成一套有關知識的經濟系統(tǒng),和知識引擎互相促進發(fā)展。對未來的預測很難,我也只是依據我自己的理解,如果有錯誤也正常。未來還沒發(fā)生,實際上我們還有選擇,未來并不是確定的,所以,我們需要盡量選擇行動,防止萬一以后出現一個超級智能,比其他所有的的總和還強大。
以上就是我主要理想的3個部分,如果世界上沒有我,世界大概也只要大概20年左右發(fā)展實現這些系統(tǒng)。所以,并不是天方夜譚不可實現的。但不論如何,對未來的預測是很困難的,我也只能以我自己的知識儲備能得出這樣的判斷,如果未來的歷史實在沒往這個方向發(fā)展,也是很正常的,我只能認為80%的可能未來是往這個方向發(fā)展的。做了一點微小的工作。謝謝。