“我們必須知道，我們必將知道” ——大衛(wèi) $\bullet$ 希爾伯特(David Hilbert)

對(duì)人類智能的模擬可通過(guò)以符號(hào)主義為核心的推理邏輯、問(wèn)題求解為核心的探尋搜索、以數(shù)據(jù)驅(qū)動(dòng)為核心的機(jī)器學(xué)習(xí)、以行為主義為核心的強(qiáng)化學(xué)習(xí)、以博弈對(duì)抗為核心的群體智能（兩人及以上）等方法實(shí)現(xiàn)
符號(hào)主義將概念符號(hào)化，從判斷（前提）出發(fā)得到新判斷（結(jié)論）；問(wèn)題求解探尋搜索依據(jù)已有信息來(lái)尋找滿足約束條件的待求解答案；數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法從數(shù)據(jù)出發(fā)，從大量數(shù)據(jù)中發(fā)現(xiàn)其所承載語(yǔ)義的內(nèi)在模式，并利用學(xué)習(xí)到的內(nèi)在模式完成識(shí)別或分類任務(wù)；行為主義為核心的強(qiáng)化學(xué)習(xí)依據(jù)環(huán)境所提供獎(jiǎng)罰反饋機(jī)制學(xué)習(xí)所處環(huán)境可采取的最佳行為模式，在搜索（未知空間）和利用（已有經(jīng)驗(yàn)）之間尋找平衡，從而形成了自我學(xué)習(xí)的能力；博弈對(duì)抗推動(dòng)了機(jī)器學(xué)習(xí)從數(shù)據(jù)最優(yōu)化擬合到均衡解的求取
圖靈機(jī)以機(jī)械方式進(jìn)行“計(jì)算”，成為了現(xiàn)代計(jì)算機(jī)的理論模型，標(biāo)志著自動(dòng)化計(jì)算時(shí)代的到來(lái)，同時(shí)成為了人工智能的“機(jī)器載體”
當(dāng)前人工智能的研究還被限制在“領(lǐng)域人工智能(domain-specific AI)或弱人工智能(narrow AI)”，無(wú)法通過(guò)自身思考達(dá)到更高層次的智能，與具有自我推理、自適應(yīng)能力特點(diǎn)的通過(guò)人工智能(general AI)存在較大差距，智能化機(jī)器無(wú)法完全取代人類

起源

1955年8月，《人工智能達(dá)特茅斯夏季研究項(xiàng)目提案》("A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence")被提出，首次使用了人工智能這個(gè)術(shù)語(yǔ)，其提到”希望機(jī)器能像人那樣認(rèn)知、思考和學(xué)習(xí)“，列舉了AI研究的七個(gè)方面問(wèn)題：自動(dòng)計(jì)算模擬人腦高級(jí)功能、使用通過(guò)語(yǔ)言進(jìn)行計(jì)算機(jī)編程及模仿推理、神經(jīng)元相互連接形成概念、對(duì)計(jì)算復(fù)雜性的度量、算法自我提升、算法的抽象、隨機(jī)性以及創(chuàng)造力等能力

人工智能是以機(jī)器為載體所實(shí)現(xiàn)的人類智能或生物智能

承載計(jì)算之能的器械如何產(chǎn)生 $\rightarrow$ 手工計(jì)算轉(zhuǎn)自動(dòng)計(jì)算
如何利用計(jì)算之器模擬人類智能 $\rightarrow$ 符號(hào)邏輯（推理為核心）、聯(lián)結(jié)主義（統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法）和行為學(xué)派（環(huán)境交互過(guò)程中進(jìn)行策略學(xué)習(xí)）等

可計(jì)算載體：形式化與機(jī)械化

自然語(yǔ)言很大程度上難以精確表達(dá)數(shù)學(xué)概念，可通過(guò)形式化語(yǔ)言來(lái)刻畫數(shù)學(xué)概念，如“任意直角三角形兩邊的平方和等于斜邊的平方” $\forall \Delta \in 直角三角形$ , $x, y, z \in \{直角邊;直角邊;斜邊\} \Rightarrow x^2 + y^2 = z^2$
已有知識(shí) $+$ 推理規(guī)則，得出先前未定義的知識(shí) $\Rightarrow$ 形式化系統(tǒng)，其可靠性信賴于以下性質(zhì)：完備性、一致性、可判斷性

哥德?tīng)柌煌陚涠ɡ?《論數(shù)學(xué)原理及有關(guān)系統(tǒng)中不可判定命題》

任何表達(dá)力足夠強(qiáng)的形式系統(tǒng)都不可能同時(shí)具有一致性arithmetical和完備性，且這個(gè)系統(tǒng)本身的一致性不能在系統(tǒng)內(nèi)被證明
哥德?tīng)柌煌陚涠ɡ?/strong>觸及了不可計(jì)算這一難題，即有些數(shù)學(xué)問(wèn)題是無(wú)法求解（不可判定）

原始遞歸和 $\lambda-calculus(\lambda驗(yàn)算)$ 都無(wú)法成為人工智能的“機(jī)器載體”

1937年，圖靈提出“圖靈機(jī)模型”，并發(fā)表了《論數(shù)字計(jì)算在決斷難題中的應(yīng)用》一文
圖靈機(jī)模型是一個(gè)抽象的機(jī)械式計(jì)算裝置，在計(jì)算過(guò)程中用了有限步驟后停機(jī)，因此它所執(zhí)行的任務(wù)是可計(jì)算的

邱奇－圖靈論題（Church-Turing thesis, computability thesis）：凡是可計(jì)算的函數(shù)都可以用圖靈機(jī)計(jì)算

原始遞歸函數(shù)、 $\lambda演算$ 和圖靈機(jī)在功能上是等效的，即任何可計(jì)算函數(shù)都可通過(guò)這三種方式完成計(jì)算、任何不可計(jì)算函數(shù)都無(wú)法通過(guò)這三種方式完成計(jì)算

前者通過(guò)形式化方法“計(jì)算”，后者通過(guò)機(jī)械化機(jī)制進(jìn)行“計(jì)算”，圖靈機(jī)推動(dòng)了自動(dòng)計(jì)算時(shí)代的到來(lái)（人工智能的“機(jī)器載體”），成為了現(xiàn)代計(jì)算機(jī)的理論模型

智能計(jì)算方法

符號(hào)主義(邏輯推理)、問(wèn)題求解（探尋搜索）、大數(shù)據(jù)驅(qū)動(dòng)（機(jī)器學(xué)習(xí)）、行為主義（強(qiáng)化學(xué)習(xí)）博弈對(duì)抗（決策智能）

以符號(hào)主義為核心的邏輯推理

推理是進(jìn)行思維模擬的基本形式之一，即從一個(gè)或幾個(gè)已知判斷推出新判斷的過(guò)程。推理、搜索和約束滿足并稱人工智能問(wèn)題求解三大方法。邏輯推理是早期AI的主流學(xué)派，稱為符號(hào)主義AI（symbolic AI）
不再使用自然語(yǔ)言進(jìn)行描述，以定義符號(hào)及符號(hào)間關(guān)系的方式，建立一套高度概括、抽象、嚴(yán)格化和精確化的符號(hào)系統(tǒng)

例如有定義：
$human(x)$ x 為凡人
$immortal(x)$ x 為非凡人
則可建立如下命題：
$human(x) \rightarrow \neg \ \ immortal(x)$
又比如亞里士多德(Aristotle)提出的三段論(syllogism)：
$\forall x(human(x) \rightarrow \lnot \ immortal(x)) \bigwedge \ human(Socrates蘇格拉底) \rightarrow \lnot \ immortal(Socrates蘇格拉底)$
凡人均不是不朽和蘇格拉底是人 推出 蘇格拉底不是不朽的

推理一般包括 $\bullet1$ 歸納(inductive)、 $\bullet2$ 演繹(deductive)和 $\bullet3$ 因果(causality)

$\bullet1$ .從特殊到一般，由具體到抽象，由現(xiàn)象到本質(zhì)
$\bullet2$ .從一般到具體，如所有金屬導(dǎo)電，銅為金屬，則銅導(dǎo)電
$\bullet3$ .“引起和被起來(lái)”關(guān)系，即判斷事物間存在的原因和結(jié)果，通常采用結(jié)構(gòu)因果(SCM,structural causal model) 和因果圖(causal diagram)

因果

關(guān)聯(lián)(association)

干預(yù)(intervention)

反事實(shí)(counterfactual)
$\{\forall \ A \Rightarrow B\}$
$Let \ (\bullet1)\ A = A^` \wedge (\bullet2)\ B = B^`$
$Watch \ \Delta \ between \bullet1 \bullet2$ 搜索是人工智能求解的一種主要技術(shù)，根據(jù)已有信息來(lái)尋找滿足約束條件的待求解問(wèn)題答案，主要包括無(wú)信息、有信息和對(duì)抗搜索(adversarial search)等
$if \ \exists \ \Delta \ is \ Large \ \Rightarrow "There \ is \ causal \ relation"$

image.png

演繹推理中原命題如成立，則逆否命令也成立，只要前提是對(duì)的，推理規(guī)則也合理，則得到的結(jié)論一定有效

注意因果與相關(guān)的區(qū)別
公雞叫與太陽(yáng)升是相關(guān)的，但不具因果，如果公雞不叫，太搜索是人工智能求解的一種主要技術(shù)，根據(jù)已有信息來(lái)尋找滿足約束條件的待求解問(wèn)題答案，主要包括無(wú)信息、有信息和對(duì)抗搜索(adversarial search)等陽(yáng)依舊會(huì)升起

有之必然，無(wú)之未必不然，是謂充分；
有之未必然，無(wú)之必不然，是謂必要；
有之必然，無(wú)之必不然，是謂充要

以上內(nèi)容 $\ \\ \Downarrow$

專家系統(tǒng)(expert system)

－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

問(wèn)題求解之探尋搜索
搜索是人工智能求解的一種主要技術(shù)，根據(jù)已有信息來(lái)尋找滿足約束條件的待求解問(wèn)題答案，主要包括無(wú)信息、有信息和對(duì)抗搜索(adversarial search)等

無(wú)信息『廣度優(yōu)先和深度優(yōu)先』
有信息『?jiǎn)l(fā)式搜索，在搜索過(guò)程中利用與所求解相關(guān)的輔助信息，代表算法如貪婪最佳優(yōu)先搜索和A搜索等』
對(duì)抗搜索『博弈搜索(game search)，在一個(gè)競(jìng)爭(zhēng)環(huán)境中相互實(shí)現(xiàn)相反利益，一方最大化，一方最小化，如最小最大搜索、Alpha-Beta剪枝搜索和蒙特卡羅樹搜索(Monte-Carlo tree search)』
蒙特卡羅樹搜索通過(guò)采樣機(jī)制來(lái)選擇合理結(jié)果而非窮舉所有結(jié)果來(lái)實(shí)現(xiàn)搜索

數(shù)據(jù)驅(qū)動(dòng)為中心的機(jī)器學(xué)習(xí)方法

與邏輯推理不同，數(shù)據(jù)驅(qū)動(dòng)(data-driven)從數(shù)據(jù)出發(fā)，利用承載表達(dá)某一概念的數(shù)據(jù)直接尋找并學(xué)習(xí)該概念所涉及的模式，基于習(xí)得的范式對(duì)未知數(shù)據(jù)進(jìn)行分類或識(shí)別。

邏輯推理 $\rightarrow$ 知識(shí)到知識(shí)
數(shù)據(jù)驅(qū)動(dòng) $\rightarrow$ 數(shù)據(jù)到知識(shí)
主要包括：
監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)等

監(jiān)督學(xué)習(xí)

收集n個(gè)標(biāo)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集，數(shù)據(jù)集中的標(biāo)注數(shù)據(jù)及其標(biāo)注信息記為 $(X, Y) = \{(x_i, y_i), i = 1, ..., n\}$ ，其中第 $i$ 個(gè)樣本數(shù)據(jù)或其特征表達(dá)記為 $x_i$ ， $y_i$ 為 $x_i$ 所對(duì)應(yīng)的類別標(biāo)注信息。
$x_i$ 為訓(xùn)練數(shù)據(jù)集合, $y_i$ 為label標(biāo)簽數(shù)據(jù)集合，為了得到語(yǔ)義信息的模式，監(jiān)督學(xué)習(xí)基于訓(xùn)練數(shù)據(jù)集，從假設(shè)空間這一學(xué)習(xí)范圍中學(xué)習(xí)到一個(gè)最優(yōu)化的映射函數(shù) $f(決策函數(shù))$ ，它將數(shù)據(jù)映射到語(yǔ)義標(biāo)注空間，實(shí)現(xiàn)數(shù)據(jù)的分類和識(shí)別
函數(shù) $f$ 對(duì) $x_i$ 的映射結(jié)果稱為 $f(x_i)$ ，一個(gè)較好的監(jiān)督學(xué)習(xí)算法使得 $f(x_i)$ 與 $y_i$ 之間的差距最小，稱該機(jī)器學(xué)習(xí)模型學(xué)會(huì)了如何將 $x_i$ 映射為其所表達(dá)的高層語(yǔ)義，之后可以利用訓(xùn)練得到的映射函數(shù)對(duì)未知數(shù)據(jù)進(jìn)行識(shí)別或分類

其他方法如可通過(guò)概率模型來(lái)進(jìn)行分類和識(shí)別

判別式學(xué)習(xí)方法，從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)條件概率分布 $P(y_i|x_i)$ ，并判斷 $x_i$ 屬于 $y_i$ 的概率，以實(shí)現(xiàn)對(duì) $x_i$ 的分類和識(shí)別

生成式學(xué)習(xí)方法，學(xué)習(xí)數(shù)據(jù)和類別標(biāo)簽的聯(lián)合分布 $P$ ，通過(guò)貝葉斯理論求取后驗(yàn)概率，完成分類和識(shí)別

赫布理論(Hebbian Theory)指出“神經(jīng)元之間持續(xù)重復(fù)經(jīng)驗(yàn)刺激可導(dǎo)致突觸傳遞效能增加(Neurons that fire together, wire together)”，認(rèn)為神經(jīng)元之間突觸的強(qiáng)弱變化是學(xué)習(xí)與記憶的生理學(xué)基礎(chǔ)，為聯(lián)結(jié)主義人工智能研究提供了認(rèn)知神經(jīng)心理學(xué)基礎(chǔ)，其代表如近年來(lái)效果顯著的深度學(xué)習(xí)。深度學(xué)習(xí)區(qū)別于其他監(jiān)督學(xué)習(xí)算法的主要特征是它沒(méi)有手工構(gòu)造特征階段，通過(guò)逐層抽象的“端到端”機(jī)制來(lái)學(xué)習(xí)數(shù)據(jù)內(nèi)部的隱藏范式，得到更強(qiáng)表達(dá)和泛化能力的特征，然后將它應(yīng)用于分類和識(shí)別任務(wù)

無(wú)監(jiān)督學(xué)習(xí)

本身不包含標(biāo)注信息

半監(jiān)督學(xué)習(xí)

部分標(biāo)注，部分不標(biāo)注

監(jiān)督學(xué)習(xí)包括回歸分析、提升算法（boosting)、支持向量機(jī)和決策樹等判別式學(xué)習(xí)方法，以及隱狄利克雷分布和隱馬爾可夫鏈等
無(wú)監(jiān)督包括聚類、降維（主成分分析）和期望極大(EM, Expectation Maximization)

行為主義為核心的強(qiáng)化學(xué)習(xí)

實(shí)現(xiàn)完全自主的智能體，其與所處環(huán)境交互，依據(jù)環(huán)境獎(jiǎng)懲機(jī)制來(lái)學(xué)習(xí)所處狀態(tài)可施加的最佳行動(dòng)

“嘗試試錯(cuò)”， “平衡未知空間與已有經(jīng)驗(yàn)”，不斷進(jìn)步，改進(jìn)行動(dòng)策略

強(qiáng)化學(xué)習(xí)（Reinforcement Learning RL）就是這樣一種賦予智能體自主監(jiān)督學(xué)習(xí)能力，能與環(huán)境交互，做出序列決策，完成序列化形式的任務(wù)的學(xué)習(xí)模型

學(xué)會(huì)學(xué)習(xí)(Learning to learn)

是一種針對(duì)序列優(yōu)化的學(xué)習(xí)方法，其與馬爾可夫決定過(guò)程(markov decision process MDP)有關(guān)，刻畫了當(dāng)前狀態(tài)采取某一行動(dòng)后如何進(jìn)入后續(xù)狀態(tài)，以及采取這一行動(dòng)后從環(huán)境獲得獎(jiǎng)懲反饋的機(jī)制
Q學(xué)習(xí)，用來(lái)學(xué)習(xí)智能體的 $q$ 函數(shù),它記錄了某個(gè)狀態(tài)下采取某一動(dòng)作所能收到的獎(jiǎng)懲值

一個(gè)較好的可行思路『將 $q$ 函數(shù)參數(shù)化，用神經(jīng)網(wǎng)絡(luò)來(lái)擬合 $q$ 函數(shù)，從而形成深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning RDL)』

監(jiān)督、無(wú)監(jiān)督和強(qiáng)化學(xué)習(xí)的差異

image.png

博弈對(duì)抗為核心的決策智能
博弈論（Game Theory）是經(jīng)學(xué)學(xué)的一個(gè)分支，博弈行為是多個(gè)帶有相互競(jìng)爭(zhēng)性質(zhì)的主體為達(dá)到各自目標(biāo)和利益，所采取的對(duì)抗性質(zhì)的行為，即“兩害相權(quán)取其輕，兩利相權(quán)取其重”

《博弈論與經(jīng)濟(jì)行為》
“非合作博弈”，納什均衡思想

現(xiàn)代博弈研究博弈行為中最優(yōu)對(duì)抗策略及其穩(wěn)定局勢(shì)，協(xié)助對(duì)弈者在一定規(guī)則范圍內(nèi)尋求最合理行為方式，機(jī)器學(xué)習(xí)結(jié)合博弈對(duì)抗方法，使得它從“尋找最優(yōu)擬合度，求取最優(yōu)解”向“求取均衡解”轉(zhuǎn)變

實(shí)際問(wèn)題

將多種機(jī)器學(xué)習(xí)算法進(jìn)行融合使用。舉例： $Deepmind$ 研制的 $AlphaGo$ 通過(guò)深度學(xué)習(xí)構(gòu)造黑白相間棋盤的特征表達(dá)，強(qiáng)化學(xué)習(xí)來(lái)進(jìn)行自我博弈以提升智能體學(xué)習(xí)能力，蒙特卡羅搜索來(lái)找尋最佳落子

類腦計(jì)算

通過(guò)仿真、模擬和借鑒大腦生理結(jié)構(gòu)和信息處理過(guò)程，在結(jié)構(gòu)層次模擬大腦，在器件層次逼近大腦

What I cannot create, I do not understand
不可造者，未能知也
??????? ??? —— 里查德 $\bullet$ 費(fèi)曼(Richard Feynman)