第一章 緒論學(xué)習(xí)記錄(人工智能導(dǎo)論)

“我們必須知道,我們必將知道” ——大衛(wèi)\bullet希爾伯特(David Hilbert)

  • 對(duì)人類智能的模擬可通過(guò)以符號(hào)主義為核心的推理邏輯、問(wèn)題求解為核心的探尋搜索、以數(shù)據(jù)驅(qū)動(dòng)為核心的機(jī)器學(xué)習(xí)、以行為主義為核心的強(qiáng)化學(xué)習(xí)、以博弈對(duì)抗為核心的群體智能(兩人及以上)等方法實(shí)現(xiàn)
  • 符號(hào)主義將概念符號(hào)化,從判斷(前提)出發(fā)得到新判斷(結(jié)論);問(wèn)題求解探尋搜索依據(jù)已有信息來(lái)尋找滿足約束條件的待求解答案;數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法從數(shù)據(jù)出發(fā),從大量數(shù)據(jù)中發(fā)現(xiàn)其所承載語(yǔ)義的內(nèi)在模式,并利用學(xué)習(xí)到的內(nèi)在模式完成識(shí)別或分類任務(wù);行為主義為核心的強(qiáng)化學(xué)習(xí)依據(jù)環(huán)境所提供獎(jiǎng)罰反饋機(jī)制學(xué)習(xí)所處環(huán)境可采取的最佳行為模式,在搜索(未知空間)和利用(已有經(jīng)驗(yàn))之間尋找平衡,從而形成了自我學(xué)習(xí)的能力;博弈對(duì)抗推動(dòng)了機(jī)器學(xué)習(xí)從數(shù)據(jù)最優(yōu)化擬合均衡解的求取
  • 圖靈機(jī)以機(jī)械方式進(jìn)行“計(jì)算”,成為了現(xiàn)代計(jì)算機(jī)的理論模型,標(biāo)志著自動(dòng)化計(jì)算時(shí)代的到來(lái),同時(shí)成為了人工智能的“機(jī)器載體”
  • 當(dāng)前人工智能的研究還被限制在“領(lǐng)域人工智能(domain-specific AI)或弱人工智能(narrow AI)”,無(wú)法通過(guò)自身思考達(dá)到更高層次的智能,與具有自我推理、自適應(yīng)能力特點(diǎn)的通過(guò)人工智能(general AI)存在較大差距,智能化機(jī)器無(wú)法完全取代人類

起源

1955年8月,《人工智能達(dá)特茅斯夏季研究項(xiàng)目提案》("A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence")被提出,首次使用了人工智能這個(gè)術(shù)語(yǔ),其提到”希望機(jī)器能像人那樣認(rèn)知、思考和學(xué)習(xí)“,列舉了AI研究的七個(gè)方面問(wèn)題:自動(dòng)計(jì)算模擬人腦高級(jí)功能、使用通過(guò)語(yǔ)言進(jìn)行計(jì)算機(jī)編程及模仿推理、神經(jīng)元相互連接形成概念、對(duì)計(jì)算復(fù)雜性的度量、算法自我提升、算法的抽象、隨機(jī)性以及創(chuàng)造力等能力

人工智能是以機(jī)器為載體所實(shí)現(xiàn)的人類智能或生物智能

承載計(jì)算之能的器械如何產(chǎn)生 \rightarrow 手工計(jì)算轉(zhuǎn)自動(dòng)計(jì)算
如何利用計(jì)算之器模擬人類智能\rightarrow 符號(hào)邏輯(推理為核心)、聯(lián)結(jié)主義(統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法)和行為學(xué)派(環(huán)境交互過(guò)程中進(jìn)行策略學(xué)習(xí))等

可計(jì)算載體:形式化與機(jī)械化

自然語(yǔ)言很大程度上難以精確表達(dá)數(shù)學(xué)概念,可通過(guò)形式化語(yǔ)言來(lái)刻畫數(shù)學(xué)概念,如“任意直角三角形兩邊的平方和等于斜邊的平方” \forall \Delta \in 直角三角形, x, y, z \in \{直角邊;直角邊;斜邊\} \Rightarrow x^2 + y^2 = z^2
已有知識(shí) + 推理規(guī)則,得出先前未定義的知識(shí) \Rightarrow 形式化系統(tǒng),其可靠性信賴于以下性質(zhì):完備性、一致性、可判斷性

哥德?tīng)柌煌陚涠ɡ?《論數(shù)學(xué)原理及有關(guān)系統(tǒng)中不可判定命題》

任何表達(dá)力足夠強(qiáng)的形式系統(tǒng)都不可能同時(shí)具有一致性arithmetical和完備性,且這個(gè)系統(tǒng)本身的一致性不能在系統(tǒng)內(nèi)被證明
哥德?tīng)柌煌陚涠ɡ?/strong>觸及了不可計(jì)算這一難題,即有些數(shù)學(xué)問(wèn)題是無(wú)法求解(不可判定)

原始遞歸\lambda-calculus(\lambda驗(yàn)算)都無(wú)法成為人工智能的“機(jī)器載體”

1937年,圖靈提出“圖靈機(jī)模型”,并發(fā)表了《論數(shù)字計(jì)算在決斷難題中的應(yīng)用》一文
圖靈機(jī)模型是一個(gè)抽象的機(jī)械式計(jì)算裝置,在計(jì)算過(guò)程中用了有限步驟后停機(jī),因此它所執(zhí)行的任務(wù)是可計(jì)算的

邱奇-圖靈論題(Church-Turing thesis, computability thesis):凡是可計(jì)算的函數(shù)都可以用圖靈機(jī)計(jì)算

原始遞歸函數(shù)、\lambda演算和圖靈機(jī)在功能上是等效的,即任何可計(jì)算函數(shù)都可通過(guò)這三種方式完成計(jì)算、任何不可計(jì)算函數(shù)都無(wú)法通過(guò)這三種方式完成計(jì)算
前者通過(guò)形式化方法“計(jì)算”,后者通過(guò)機(jī)械化機(jī)制進(jìn)行“計(jì)算”,圖靈機(jī)推動(dòng)了自動(dòng)計(jì)算時(shí)代的到來(lái)(人工智能的“機(jī)器載體”),成為了現(xiàn)代計(jì)算機(jī)的理論模型

智能計(jì)算方法

符號(hào)主義(邏輯推理)、問(wèn)題求解(探尋搜索)、大數(shù)據(jù)驅(qū)動(dòng)(機(jī)器學(xué)習(xí))、行為主義(強(qiáng)化學(xué)習(xí))博弈對(duì)抗(決策智能)

  • 以符號(hào)主義為核心的邏輯推理

推理是進(jìn)行思維模擬的基本形式之一,即從一個(gè)或幾個(gè)已知判斷推出新判斷的過(guò)程。推理、搜索和約束滿足并稱人工智能問(wèn)題求解三大方法。邏輯推理是早期AI的主流學(xué)派,稱為符號(hào)主義AI(symbolic AI)
不再使用自然語(yǔ)言進(jìn)行描述,以定義符號(hào)及符號(hào)間關(guān)系的方式,建立一套高度概括、抽象、嚴(yán)格化和精確化的符號(hào)系統(tǒng)

例如有定義:
human(x) x 為凡人
immortal(x) x 為 非凡人
則可建立如下命題:
human(x) \rightarrow \neg \ \ immortal(x)
又比如 亞里士多德(Aristotle)提出的三段論(syllogism):
\forall x(human(x) \rightarrow \lnot \ immortal(x)) \bigwedge \ human(Socrates蘇格拉底) \rightarrow \lnot \ immortal(Socrates蘇格拉底)
凡人均不是不朽和蘇格拉底是人 推出 蘇格拉底不是不朽的

推理一般包括\bullet1歸納(inductive)、\bullet2演繹(deductive)和\bullet3因果(causality)

\bullet1.從特殊到一般,由具體到抽象,由現(xiàn)象到本質(zhì)
\bullet2.從一般到具體,如所有金屬導(dǎo)電,銅為金屬,則銅導(dǎo)電
\bullet3.“引起和被起來(lái)”關(guān)系,即判斷事物間存在的原因和結(jié)果,通常采用結(jié)構(gòu)因果(SCM,structural causal model) 和因果圖(causal diagram)

因果
  • 關(guān)聯(lián)(association)
  • 干預(yù)(intervention)
  • 反事實(shí)(counterfactual)
    \{\forall \ A \Rightarrow B\}
    Let \ (\bullet1)\ A = A^` \wedge (\bullet2)\ B = B^`
    Watch \ \Delta \ between \bullet1 \bullet2搜索是人工智能求解的一種主要技術(shù),根據(jù)已有信息來(lái)尋找滿足約束條件的待求解問(wèn)題答案,主要包括無(wú)信息、有信息和對(duì)抗搜索(adversarial search)等
    if \ \exists \ \Delta \ is \ Large \ \Rightarrow "There \ is \ causal \ relation"
image.png

演繹推理中原命題如成立,則逆否命令也成立,只要前提是對(duì)的,推理規(guī)則也合理,則得到的結(jié)論一定有效

注意因果與相關(guān)區(qū)別
公雞叫與太陽(yáng)升是相關(guān)的,但不具因果,如果公雞不叫,太搜索是人工智能求解的一種主要技術(shù),根據(jù)已有信息來(lái)尋找滿足約束條件的待求解問(wèn)題答案,主要包括無(wú)信息、有信息和對(duì)抗搜索(adversarial search)等陽(yáng)依舊會(huì)升起

有之必然,無(wú)之未必不然,是謂充分;
有之未必然,無(wú)之必不然,是謂必要;
有之必然,無(wú)之必不然,是謂充要

以上內(nèi)容 \ \\ \Downarrow

專家系統(tǒng)(expert system)

----------------------------------------

  • 問(wèn)題求解之探尋搜索
    搜索是人工智能求解的一種主要技術(shù),根據(jù)已有信息來(lái)尋找滿足約束條件的待求解問(wèn)題答案,主要包括無(wú)信息、有信息和對(duì)抗搜索(adversarial search)等

無(wú)信息 『廣度優(yōu)先和深度優(yōu)先』
有信息 『?jiǎn)l(fā)式搜索,在搜索過(guò)程中利用與所求解相關(guān)的輔助信息,代表算法如貪婪最佳優(yōu)先搜索和A搜索等』
對(duì)抗搜索 『博弈搜索(game search),在一個(gè)競(jìng)爭(zhēng)環(huán)境中相互實(shí)現(xiàn)相反利益,一方最大化,一方最小化,如最小最大搜索、Alpha-Beta剪枝搜索和蒙特卡羅樹搜索(Monte-Carlo tree search)』
蒙特卡羅樹搜索通過(guò)采樣機(jī)制來(lái)選擇合理結(jié)果而非窮舉所有結(jié)果來(lái)實(shí)現(xiàn)搜索

  • 數(shù)據(jù)驅(qū)動(dòng)為中心的機(jī)器學(xué)習(xí)方法

與邏輯推理不同,數(shù)據(jù)驅(qū)動(dòng)(data-driven)從數(shù)據(jù)出發(fā),利用承載表達(dá)某一概念的數(shù)據(jù)直接尋找并學(xué)習(xí)該概念所涉及的模式,基于習(xí)得的范式對(duì)未知數(shù)據(jù)進(jìn)行分類或識(shí)別。

邏輯推理 \rightarrow 知識(shí)到知識(shí)
數(shù)據(jù)驅(qū)動(dòng) \rightarrow 數(shù)據(jù)到知識(shí)
主要包括:
監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)等

監(jiān)督學(xué)習(xí)

收集n個(gè)標(biāo)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,數(shù)據(jù)集中的標(biāo)注數(shù)據(jù)及其標(biāo)注信息記為(X, Y) = \{(x_i, y_i), i = 1, ..., n\},其中第i個(gè)樣本數(shù)據(jù)或其特征表達(dá)記為x_iy_ix_i所對(duì)應(yīng)的類別標(biāo)注信息。
x_i為訓(xùn)練數(shù)據(jù)集合, y_i為label標(biāo)簽數(shù)據(jù)集合, 為了得到語(yǔ)義信息的模式,監(jiān)督學(xué)習(xí)基于訓(xùn)練數(shù)據(jù)集,從假設(shè)空間這一學(xué)習(xí)范圍中學(xué)習(xí)到一個(gè)最優(yōu)化的映射函數(shù)f(決策函數(shù)),它將數(shù)據(jù)映射語(yǔ)義標(biāo)注空間,實(shí)現(xiàn)數(shù)據(jù)的分類和識(shí)別
函數(shù)f對(duì)x_i的映射結(jié)果稱為f(x_i),一個(gè)較好的監(jiān)督學(xué)習(xí)算法使得f(x_i)y_i之間的差距最小,稱該機(jī)器學(xué)習(xí)模型學(xué)會(huì)了如何將x_i映射為其所表達(dá)的高層語(yǔ)義,之后可以利用訓(xùn)練得到的映射函數(shù)對(duì)未知數(shù)據(jù)進(jìn)行識(shí)別或分類

其他方法如可通過(guò)概率模型來(lái)進(jìn)行分類和識(shí)別

  • 判別式學(xué)習(xí)方法,從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)條件概率分布P(y_i|x_i),并判斷x_i屬于y_i的概率,以實(shí)現(xiàn)對(duì)x_i的分類和識(shí)別
  • 生成式學(xué)習(xí)方法,學(xué)習(xí)數(shù)據(jù)和類別標(biāo)簽的聯(lián)合分布P,通過(guò)貝葉斯理論求取后驗(yàn)概率,完成分類和識(shí)別

赫布理論(Hebbian Theory)指出“神經(jīng)元之間持續(xù)重復(fù)經(jīng)驗(yàn)刺激可導(dǎo)致突觸傳遞效能增加(Neurons that fire together, wire together)”,認(rèn)為神經(jīng)元之間突觸的強(qiáng)弱變化是學(xué)習(xí)與記憶的生理學(xué)基礎(chǔ),為聯(lián)結(jié)主義人工智能研究提供了認(rèn)知神經(jīng)心理學(xué)基礎(chǔ),其代表如近年來(lái)效果顯著的深度學(xué)習(xí)。深度學(xué)習(xí)區(qū)別于其他監(jiān)督學(xué)習(xí)算法的主要特征是它沒(méi)有手工構(gòu)造特征階段,通過(guò)逐層抽象的“端到端”機(jī)制來(lái)學(xué)習(xí)數(shù)據(jù)內(nèi)部的隱藏范式,得到更強(qiáng)表達(dá)和泛化能力的特征,然后將它應(yīng)用于分類和識(shí)別任務(wù)

無(wú)監(jiān)督學(xué)習(xí)

本身不包含標(biāo)注信息

半監(jiān)督學(xué)習(xí)

部分標(biāo)注,部分不標(biāo)注

監(jiān)督學(xué)習(xí)包括回歸分析、提升算法(boosting)、支持向量機(jī)和決策樹等判別式學(xué)習(xí)方法,以及隱狄利克雷分布和隱馬爾可夫鏈等
無(wú)監(jiān)督包括聚類、降維(主成分分析)和期望極大(EM, Expectation Maximization)

  • 行為主義為核心的強(qiáng)化學(xué)習(xí)

實(shí)現(xiàn)完全自主的智能體,其與所處環(huán)境交互,依據(jù)環(huán)境獎(jiǎng)懲機(jī)制來(lái)學(xué)習(xí)所處狀態(tài)可施加的最佳行動(dòng)

“嘗試試錯(cuò)”, “平衡未知空間與已有經(jīng)驗(yàn)”,不斷進(jìn)步,改進(jìn)行動(dòng)策略

強(qiáng)化學(xué)習(xí)(Reinforcement Learning RL)就是這樣一種賦予智能體自主監(jiān)督學(xué)習(xí)能力,能與環(huán)境交互,做出序列決策,完成序列化形式的任務(wù)的學(xué)習(xí)模型

學(xué)會(huì)學(xué)習(xí)(Learning to learn)

是一種針對(duì)序列優(yōu)化的學(xué)習(xí)方法,其與馬爾可夫決定過(guò)程(markov decision process MDP)有關(guān),刻畫了當(dāng)前狀態(tài)采取某一行動(dòng)后如何進(jìn)入后續(xù)狀態(tài),以及采取這一行動(dòng)后從環(huán)境獲得獎(jiǎng)懲反饋的機(jī)制
Q學(xué)習(xí),用來(lái)學(xué)習(xí)智能體的q函數(shù),它記錄了某個(gè)狀態(tài)下采取某一動(dòng)作所能收到的獎(jiǎng)懲值

一個(gè)較好的可行思路『將q函數(shù)參數(shù)化,用神經(jīng)網(wǎng)絡(luò)來(lái)擬合q函數(shù),從而形成深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning RDL)』

監(jiān)督、無(wú)監(jiān)督和強(qiáng)化學(xué)習(xí)的差異

image.png
  • 博弈對(duì)抗為核心的決策智能
    博弈論(Game Theory)是經(jīng)學(xué)學(xué)的一個(gè)分支,博弈行為是多個(gè)帶有相互競(jìng)爭(zhēng)性質(zhì)的主體為達(dá)到各自目標(biāo)和利益,所采取的對(duì)抗性質(zhì)的行為,即“兩害相權(quán)取其輕,兩利相權(quán)取其重”

《博弈論與經(jīng)濟(jì)行為》
“非合作博弈”, 納什均衡思想

現(xiàn)代博弈研究博弈行為中最優(yōu)對(duì)抗策略及其穩(wěn)定局勢(shì),協(xié)助對(duì)弈者在一定規(guī)則范圍內(nèi)尋求最合理行為方式,機(jī)器學(xué)習(xí)結(jié)合博弈對(duì)抗方法,使得它從“尋找最優(yōu)擬合度,求取最優(yōu)解”“求取均衡解”轉(zhuǎn)變

實(shí)際問(wèn)題

將多種機(jī)器學(xué)習(xí)算法進(jìn)行融合使用。舉例:Deepmind研制的AlphaGo通過(guò)深度學(xué)習(xí)構(gòu)造黑白相間棋盤的特征表達(dá),強(qiáng)化學(xué)習(xí)來(lái)進(jìn)行自我博弈以提升智能體學(xué)習(xí)能力,蒙特卡羅搜索來(lái)找尋最佳落子

類腦計(jì)算

通過(guò)仿真、模擬和借鑒大腦生理結(jié)構(gòu)和信息處理過(guò)程,在結(jié)構(gòu)層次模擬大腦,在器件層次逼近大腦

What I cannot create, I do not understand
不可造者,未能知也
??????? ??? —— 里查德\bullet費(fèi)曼(Richard Feynman)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容