[轉(zhuǎn)]十分鐘了解人工智能AI的基礎(chǔ)運(yùn)作原理
人工智能是如何運(yùn)作的
人工智能企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能從誕生以來,理論和技術(shù)日益成熟,應(yīng)用領(lǐng)域也不斷擴(kuò)大,可以預(yù)見未來幾年將會進(jìn)入“人工智能時代”。
目前AI已經(jīng)在日常生活中產(chǎn)生了巨大的變化。這些AI并不是科幻電影中的那些有自我意識,計劃摧毀地球的機(jī)器人。而是像我們的智能手機(jī)、智能家居、銀行信用卡管家和智能汽車這些圍繞我們每天生活的產(chǎn)品和服務(wù)都在使用AI。
AI將通過推動自動駕駛汽車的發(fā)展、改善醫(yī)學(xué)圖像分析、促進(jìn)更好的醫(yī)療診斷和個性化醫(yī)療,從而帶來社會的重大轉(zhuǎn)變。AI也將是支撐未來技術(shù)發(fā)展的基礎(chǔ)資源,就像電力和網(wǎng)絡(luò)一樣。但對大部分人來說,AI還是很詭異而且充滿神秘感。
那么我們今天就來聊一聊AI最重要的功能——模式識別的工作原理。希望通過簡明扼要的介紹幫助大家了解這個領(lǐng)域。
AI是一門嚴(yán)謹(jǐn)科學(xué)而不是無所不能神話故事,有些媒體過分夸大報道AI的功能,鼓吹威脅論都是不負(fù)責(zé)任的。AI目標(biāo)是設(shè)計具有智能的機(jī)器,其中的算法和技術(shù)部分借鑒了當(dāng)下對人腦的研究成果。今天許多流行的AI系統(tǒng)使用人工神經(jīng)網(wǎng)絡(luò)來模擬由非常簡單的互相連接單元組成的網(wǎng)絡(luò),有點(diǎn)像大腦中的神經(jīng)元。這些網(wǎng)絡(luò)可以通過調(diào)整單元之間的連接來學(xué)習(xí)經(jīng)驗(yàn),這個過程類似人類和動物的大腦通過修改神經(jīng)元之間的連接來進(jìn)行學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)模式識別、翻譯語言、學(xué)習(xí)簡單的邏輯推理,甚至創(chuàng)建圖像或者形成新設(shè)計。 其中,模式識別是一項(xiàng)特別重要的功能,因?yàn)锳I十分擅于識別海量數(shù)據(jù)中的隱藏的模式,而這對于依賴經(jīng)驗(yàn)和知識的人類來說就沒有那么容易。這些程序運(yùn)行的神經(jīng)網(wǎng)絡(luò)具有數(shù)百萬單位和數(shù)十億的連接。我們現(xiàn)在所能創(chuàng)造出來的“智能”就是由這些電子神經(jīng)元網(wǎng)絡(luò)組成的。
機(jī)器不像人類具有感知器官和大腦,并且能夠很好地協(xié)調(diào)工作,比如當(dāng)我們看到一只狗的時候,就會很快的判斷出來這是什么動物,并且具體什么種類。這個看似簡單的過程對于機(jī)器來說都是十分困難的。而人類獲得這樣的能力,也是源自于生物上億年的進(jìn)化過程。而機(jī)器認(rèn)識世界的方式是通過模型,需要通過復(fù)雜的算法和數(shù)據(jù)來構(gòu)建模型,從而使機(jī)器獲得很簡單的感知和判斷的能力。
下面介紹一下深度學(xué)習(xí)系統(tǒng)中一個最重要算法——卷積神經(jīng)網(wǎng)絡(luò)。如果你之前對AI相關(guān)知識有所了解的話,那你一定聽說這個概念。這種算法參考了生物學(xué)研究人類和其他動物大腦視覺皮層的結(jié)構(gòu)。簡單介紹一下這種特定類型的人工神經(jīng)網(wǎng)絡(luò),它使用感知器、機(jī)器學(xué)習(xí)單元算法,用于監(jiān)督學(xué)習(xí)分析數(shù)據(jù)。適用于圖像處理、自然語言處理和其他類型的認(rèn)知任務(wù)。與其他類型的人工神經(jīng)網(wǎng)絡(luò)一樣,卷積神經(jīng)網(wǎng)絡(luò)具有輸入層、輸出層和各種隱藏層。其中一些層是卷積的,使用數(shù)學(xué)模型將結(jié)果傳遞給連續(xù)的層。這過程模擬了人類視覺皮層中的一些動作,所以稱為卷積神經(jīng)網(wǎng)路,也就是CNN。
舉例子來看,當(dāng)我們?nèi)祟惪吹揭恢回埡鸵恢还窌r,盡管它們的體型很類似,但我們還是馬上能夠區(qū)分它們分別是貓和狗。對計算機(jī)而言,圖像僅僅只是一串?dāng)?shù)據(jù)。在神經(jīng)網(wǎng)絡(luò)的第一層會通過特征檢測物體的輪廓。神經(jīng)網(wǎng)絡(luò)的下一層將檢測這些簡單圖案的組合所形成的簡單形狀,比如動物眼睛和耳朵。再下一層將檢測這些形狀組合所構(gòu)成的物體的某些部分,例如貓和狗的頭或者腿。神經(jīng)網(wǎng)絡(luò)的最后一層將檢測剛才那些部分的組合:一只完整的貓、一只完整的狗等等。每一層的神經(jīng)網(wǎng)絡(luò)都會目標(biāo)進(jìn)行圖像組合分析和特征檢測,從而進(jìn)行判斷和組合,并將結(jié)果傳遞給下一層神經(jīng)網(wǎng)絡(luò)。實(shí)際使用的神經(jīng)網(wǎng)絡(luò)的層次深度會比這個例子多很多,所以神經(jīng)網(wǎng)絡(luò)能夠以這種分層的方式進(jìn)行復(fù)雜的模式識別。
只要有大量被標(biāo)記的樣本數(shù)據(jù)庫,就可以對神經(jīng)網(wǎng)絡(luò)進(jìn)行特征訓(xùn)練。它對于識別圖像、視頻、語音、音樂甚至文本等信息特別有用。為了很好地訓(xùn)練AI的機(jī)器視覺,我們需要提供給這些神經(jīng)網(wǎng)絡(luò)被人標(biāo)記的大量圖像數(shù)據(jù)。神經(jīng)網(wǎng)絡(luò)會學(xué)習(xí)將每個圖像與其相應(yīng)的標(biāo)簽并相互關(guān)聯(lián)起來。還能將以前從未見過的圖像及其相應(yīng)的標(biāo)簽配對。這樣的系統(tǒng)可以梳理各種各樣的圖像,并且識別照片中的元素。同時神經(jīng)網(wǎng)絡(luò)在語音識別和文本識別中也非常有用,自動駕駛汽車和最新醫(yī)學(xué)圖像分析系統(tǒng)中也是關(guān)鍵組成部分,所以你可以看到神經(jīng)網(wǎng)絡(luò)的運(yùn)用是非常廣泛而且有效的。原來需要依賴人工標(biāo)記大量有效數(shù)據(jù)來完成知識的輸入,現(xiàn)在通過運(yùn)行海量數(shù)據(jù),讓神經(jīng)網(wǎng)絡(luò)進(jìn)行自我學(xué)習(xí)。大大提升的人工智能的應(yīng)用范圍,降低了使用的門檻。
人類大腦與動物遠(yuǎn)遠(yuǎn)不同,在進(jìn)化過程中高度特化并且具有明顯的適應(yīng)性。而當(dāng)前的AI系統(tǒng)遠(yuǎn)遠(yuǎn)不具有人類擁有的看似一般的智能。人工智能更高級的發(fā)展將會在后面進(jìn)行討論,我們這里還是關(guān)注現(xiàn)在實(shí)現(xiàn)的AI的基本原理。
AI最常見的三種學(xué)習(xí)方式
強(qiáng)化學(xué)習(xí)這是關(guān)于機(jī)器應(yīng)該如何行動以獲得最大化獎勵的問題,它受行為心理學(xué)理論的啟發(fā)。在特定場景下,機(jī)器挑選一個動作或一系列動作并獲得獎勵。機(jī)器行為每一步驟都會被標(biāo)記,并且記錄結(jié)果和賦予權(quán)重。強(qiáng)化學(xué)習(xí)通常用于教機(jī)器玩游戲和贏得比賽,比如國際象棋、圍棋或簡單的視頻游戲。強(qiáng)化學(xué)習(xí)的問題是,單純地強(qiáng)化學(xué)習(xí)需要海量的試錯,才能學(xué)會簡單的任務(wù)。好處是只要你提出一個有價值的問題,提供足夠的數(shù)據(jù)輸入,理論上來說強(qiáng)化學(xué)習(xí)最終會找到那個最優(yōu)解。
監(jiān)督學(xué)習(xí)就是需要我們告訴機(jī)器特定輸入的正確答案: 這是一幅汽車的圖像,正確答案是“汽車”。它之所以被稱為監(jiān)督學(xué)習(xí),是因?yàn)樗惴ㄊ菑膸?biāo)簽數(shù)據(jù)學(xué)習(xí)的。這個過程類似于向年幼的孩子展示圖畫書。成年人預(yù)先知道正確的答案,孩子根據(jù)前面的例子做出推測。這也是訓(xùn)練神經(jīng)網(wǎng)絡(luò)和其他機(jī)器學(xué)習(xí)體系結(jié)構(gòu)最常用的技術(shù)。
無監(jiān)督學(xué)習(xí)人類和大多數(shù)其他動物的學(xué)習(xí)過程,特別是剛生下來的時候,是以沒有人監(jiān)督的方式來進(jìn)行學(xué)習(xí)的:我們通過觀察和認(rèn)知我們行動的結(jié)果來了解世界如何運(yùn)作。沒有人告訴我們剛開始所看到的每一個物體的名稱和功能。但我們?nèi)匀粚W(xué)會非?;镜母拍睿?dāng)前我們還不知道如何在機(jī)器身上實(shí)現(xiàn)這一點(diǎn),至少無法達(dá)到人類和其他動物的水平。缺乏用于無監(jiān)督學(xué)習(xí)的AI技術(shù),也是當(dāng)前AI發(fā)展問題之一。
概括來說當(dāng)前AI技術(shù)原理是:將大量數(shù)據(jù)與超強(qiáng)的運(yùn)算處理能力和智能算法三者相結(jié)合起來,建立一個解決特定問題的模型,使程序能夠自動地從數(shù)據(jù)中學(xué)習(xí)潛在的模式或特征,從而實(shí)現(xiàn)接近人類的思考方式。下面補(bǔ)充介紹三個AI研究領(lǐng)域重要的理論方法和技術(shù)以便理解:
一、機(jī)器學(xué)習(xí)自動化分析建模
它使用來自神經(jīng)網(wǎng)絡(luò)、統(tǒng)計、數(shù)學(xué)和物理學(xué)的方法來發(fā)現(xiàn)數(shù)據(jù)中的隱藏模型,并且無需明確編程查找具體目標(biāo)和范圍。理論基礎(chǔ)是這樣的:假如我們?yōu)榱搜芯磕硞€復(fù)雜的科學(xué)問題,需要創(chuàng)建海量的機(jī)器學(xué)習(xí)模型、使用大量的算法、使用不同的參數(shù)配置,在這種情況下,我們就可以使用自動化的方式進(jìn)行建模。發(fā)展自動化機(jī)器學(xué)習(xí)是為了向科學(xué)家提供幫助,而不是代替他們。這些方法使數(shù)據(jù)科學(xué)家擺脫了令人厭煩和復(fù)雜耗時的任務(wù)(比如詳細(xì)的參數(shù)優(yōu)化和調(diào)試),機(jī)器可以更好地解決這些任務(wù)。而后面的數(shù)據(jù)分析與結(jié)論的工作仍然需要人類專家來完成。在未來,理解行業(yè)應(yīng)用領(lǐng)域的數(shù)據(jù)科學(xué)家,也就是數(shù)據(jù)業(yè)務(wù)架構(gòu)師,仍然極其的重要。而這一項(xiàng)人工智能技術(shù),將會輔助數(shù)據(jù)科學(xué)家建立模型并且加速驗(yàn)證的速度,從而減輕科學(xué)家的壓力,讓他們將精力放在那些機(jī)器無法完成的任務(wù)上面,通過更加合理的分工協(xié)作,大大加快科學(xué)技術(shù)研發(fā)速度。
二、深度學(xué)習(xí)領(lǐng)域
這是應(yīng)用非常廣的技術(shù),它使用具有多層處理單元的巨大神經(jīng)網(wǎng)絡(luò),利用強(qiáng)大計算能力和改進(jìn)的訓(xùn)練技術(shù)來學(xué)習(xí)大量數(shù)據(jù)中的復(fù)雜模式。原理是計算機(jī)在學(xué)習(xí)特定問題時,需要大量輸入這個問題相關(guān)的學(xué)習(xí)材料也就是數(shù)據(jù),然后在計算機(jī)通過算法和模型來構(gòu)建對這個具體問題的認(rèn)知,也就是總結(jié)出一個規(guī)律,那么在以后遇到相似問題時,計算機(jī)會把收集的數(shù)據(jù)轉(zhuǎn)成特征值,如果這個特征值符合這前面規(guī)律里面的特征值,那么這個事物、行為或者模式,就可以被識別出來。常見的應(yīng)用太多了,這里大概舉一些例子:
計算機(jī)視覺,這就像是機(jī)器的“眼睛”。依賴于模式識別和深度學(xué)習(xí)來識別圖片或視頻中的內(nèi)容。當(dāng)機(jī)器可以分析和理解圖像時,他們可以實(shí)時捕捉圖像或視頻并解讀周圍環(huán)境。感知周圍環(huán)境、識別可行駛區(qū)域以及識別行駛路徑,這也是無人駕駛的基礎(chǔ)技術(shù)。其中圖像識別原理是通過識別圖片中的對象,然后建立標(biāo)簽,實(shí)現(xiàn)對海量圖片進(jìn)行分類,也可以對圖像中的人臉或者其他目標(biāo)進(jìn)行識別,運(yùn)用在安防監(jiān)控等領(lǐng)域;
自然語言處理中語音識別技術(shù)就像是機(jī)器的“耳朵”:這是計算機(jī)分析、理解和生成人類語言和語音的能力。運(yùn)用語音采集的技術(shù)和方法,對音頻中的語言內(nèi)容進(jìn)行提取和識別,實(shí)現(xiàn)語音實(shí)時轉(zhuǎn)文字的功能;下一階段將會是自然語言交互,人們將可以使用普通的日常語言與計算機(jī)進(jìn)行交流和執(zhí)行任務(wù)。這也是AI語音助手和語音控制交互技術(shù)的基礎(chǔ)。
機(jī)器翻譯:模仿人腦理解語言的過程,形成更加符合語法規(guī)則同時更加容易被人理解的翻譯,谷歌在線翻譯功能就是運(yùn)用了深度學(xué)習(xí)技術(shù),讓機(jī)器的翻譯水平大大提升;
情感識別:通過識別新聞、社交媒體、論壇等文本內(nèi)容中所包含的情感因素,及時了解網(wǎng)絡(luò)用戶對新聞的興趣;
醫(yī)療診斷:比如通過對各個階段的腫瘤診斷這類醫(yī)療圖像數(shù)據(jù)進(jìn)行學(xué)習(xí),總結(jié)出惡性腫瘤形狀、紋理、結(jié)構(gòu)等“特征”模型,從而使機(jī)器可以進(jìn)行判斷。
可以看到深度學(xué)習(xí)在神經(jīng)元網(wǎng)絡(luò)的基礎(chǔ)上,發(fā)展出了非常多的應(yīng)用案例,并且當(dāng)下各個行業(yè)的人工智能輔助工具和軟件都在大力開發(fā)中,各種數(shù)據(jù)都在大量采集、清洗、輸入模型訓(xùn)練,一旦訓(xùn)練成功就可以大規(guī)模部署,帶來巨大的商業(yè)價值。具體有多大呢?參考一下人臉識別領(lǐng)域的獨(dú)角企業(yè)估值和號稱千億的市場規(guī)模就知道了。如果這樣的市場再乘以百倍、千倍呢,這里面的蘊(yùn)含商業(yè)機(jī)會有多少呢?
三、認(rèn)知計算
這也是人工智能的子領(lǐng)域,目標(biāo)是與機(jī)器進(jìn)行自然的、類似人類的交互。使用人工智能和認(rèn)知計算,最終目標(biāo)是讓機(jī)器獲得理解圖像和語音的能力,模擬人類交流過程,從而實(shí)現(xiàn)與人類的自然對話。也是根據(jù)神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)來構(gòu)建的,應(yīng)用來自認(rèn)知科學(xué)的知識來構(gòu)建模擬人類思維過程的系統(tǒng)。它涵蓋多個學(xué)科,包括機(jī)器學(xué)習(xí)、自然語言處理、視覺和人機(jī)交互。IBM Watson就是認(rèn)知計算的一個例子,在美國答題競賽節(jié)目上Watson展現(xiàn)了它先進(jìn)的問答交互能力,并且打敗了人類。與此,同時Watson這些服務(wù)應(yīng)用接口也進(jìn)行了開放,可提供其他組織用于視覺識別、語音識別、語言翻譯以及對話引擎等等。
就像AI的產(chǎn)生是多學(xué)科發(fā)展的綜合成果一樣,當(dāng)下AI的快速發(fā)展也是多方面技術(shù)進(jìn)步綜合起來取得的成果,總結(jié)里面重要的三個方面:
1.硬件方面:
直到本世紀(jì)初研究人員才意識到,為視頻游戲設(shè)計的GPU圖形處理單元可以被用作硬件加速器,以運(yùn)行比以前更大的神經(jīng)網(wǎng)絡(luò)。這要?dú)w功于這些芯片能夠進(jìn)行大量并行計算,而不是像傳統(tǒng)CPU那樣按順序處理它們。這對于同時計算構(gòu)成深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的數(shù)百個神經(jīng)元的權(quán)重特別有用。
2.通用算法:
AI這么快就流行起來,在很大程度上是因?yàn)殚_放的軟件工具也稱為框架,使得構(gòu)建和訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)目標(biāo)應(yīng)用程序變得容易起來,即使是使用各種不同的編程語言。對于已知的識別目標(biāo),可以離線定義和訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)。一旦訓(xùn)練完成,神經(jīng)網(wǎng)絡(luò)可以很容易地部署到嵌入式平臺上,也可以遷移到各種軟件程序和硬件平臺中。這是一個聰明的架構(gòu),允許借助PC或云的能力訓(xùn)練神經(jīng)網(wǎng)絡(luò),而低功耗的嵌入式處理器只需使用訓(xùn)練好的數(shù)據(jù)來進(jìn)行識別。人體和物體的能力與流行的應(yīng)用密切相關(guān),比如工業(yè)機(jī)器人和自動駕駛汽車。
3.其他技術(shù)支持:
圖形處理單元是AI的關(guān)鍵,因?yàn)樗鼈兲峁┝说幚硭璧拇罅坑嬎隳芰ΑS?xùn)練神經(jīng)網(wǎng)絡(luò)需要大數(shù)據(jù)和計算能力。而物聯(lián)網(wǎng)從連接的設(shè)備生成大量數(shù)據(jù),其中大部分未經(jīng)分析。使用AI自動化模型將允許我們使用更多的物聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行分析,將物流和信息流更好的結(jié)合起來。還有就是AI應(yīng)用程序接口,可以將AI功能添加到現(xiàn)有產(chǎn)品和軟件中。比如它們可以為安防視頻中添加圖像識別功能;也可以在我們觀看網(wǎng)絡(luò)視頻時,自動創(chuàng)建翻譯和字幕;或者是在相機(jī)中識別人物性別和年紀(jì)甚至是表情和狀態(tài)等等,應(yīng)用將會非常廣泛。
總之,這都是AI經(jīng)常使用的方法,即使我們創(chuàng)造了單個項(xiàng)目擁有超越人類智慧的機(jī)器,這些機(jī)器仍然能力有限。短期來看,人工智能將提供接近人類交互體驗(yàn),并為特定任務(wù)提供輔助支持,但它還不能成為人類的替代品,有自我意識的AI還不會很快出現(xiàn)。
本篇是老張創(chuàng)作的課程《人工智能進(jìn)化論課程》基礎(chǔ)篇內(nèi)容,轉(zhuǎn)載需授權(quán)。
覺得有幫助的話請轉(zhuǎn)發(fā)和評論~