易 AI - 人工智能基本概念與產業(yè)生態(tài)

原文:https://makeoptim.com/deep-learning/yiai-concepts

本文將為大家介紹以下人工智能(Artificial Intelligence)相關概念的含義和區(qū)別

  • 機器學習(Machine Learning)
  • 監(jiān)督學習(Supervised Learning)
  • 無監(jiān)督學習(Unsupervised Learning)
  • 強化學習(Reinforcement Learning)
  • 深度學習(Deep Learning)
  • 遷移學習(Transfer Learning)
  • 聯(lián)邦學習(Federated Learning)
image

同時,介紹人工智能整個產業(yè)的生態(tài),讓大家對人工智能有一個基本的認識。

人工智能

image

人工智能誕生于 20 世紀 50 年代,定義為:努力將通常由人類完成的智力任務自動化。因此,人工智能是一個綜合性的領域,不僅包括機器學習,還包括更多不涉及學習的方法。比如,早期的符號主義人工智能(硬編碼)、專家系統(tǒng)等。

雖然符號主義人工智能適合用來解決定義明確的邏輯問題,但它難以給出明確的規(guī)則來解決更加復雜、模糊的問題,比如圖像分類、語音識別語言翻譯。于是出現(xiàn)了一種新的方法來替代符號主義人工智能,這就是機器學習。

機器學習

機器學習是實現(xiàn)人工智能的一種方法

在經典的程序設計中,人們輸入的是規(guī)則(即程序)和數(shù)據(jù),系統(tǒng)輸出的是答案。

image

而機器學習,輸入的是數(shù)據(jù)和預期得到的答案,系統(tǒng)輸出的是規(guī)則。這些規(guī)則隨后可應用于新的數(shù)據(jù),并使計算機自主生成答案

image

因此,機器學習系統(tǒng)是訓練出來的,而不是明確地用程序編寫出來的。將與某個任務相關的許多示例輸入機器學習系統(tǒng),它會在這些示例中找到統(tǒng)計結構,從而最終找到規(guī)則將任務自動化。

機器學習根據(jù)形式可分為:

  • 監(jiān)督學習
  • 無監(jiān)督學習
  • 強化學習

監(jiān)督學習

事先(有經驗)為數(shù)據(jù)標記標簽(答案) 的訓練形式就是監(jiān)督學習。訓練目標是能夠給新數(shù)據(jù)以正確的標簽。

image

舉個例子,媽媽拿了很多鴨子、兔子圖片(數(shù)據(jù))給小朋友看,并且告訴它這個是鴨子、那個是兔子(標簽)。小朋友通過媽媽多次的指導(訓練),下次再拿一個新的鴨子圖片,就會辨認出來了(找到規(guī)則)。

監(jiān)督學習常用于任務驅動回歸或者分類問題。

無監(jiān)督學習

當缺乏足夠的先驗知識,難以標注類別時,根據(jù)未加標簽的訓練數(shù)據(jù)解決模式識別中的各種問題,稱之為無監(jiān)督學習。

image

大家都聽過“啤酒+尿不濕”的故事,這個故事就是根據(jù)用戶的購買行為來推薦相關的商品的一個例子。比如大家在淘寶、天貓、京東上逛的時候,總會根據(jù)你的瀏覽行為推薦一些相關的商品,有些商品就是無監(jiān)督學習通過聚類來推薦出來的。系統(tǒng)會發(fā)現(xiàn)一些購買行為相似的用戶,推薦這類用戶最”喜歡”的商品。

監(jiān)督學習常用于數(shù)據(jù)驅動聚類問題。

強化學習

強化學習強調如何基于環(huán)境而行動,以取得最大化的預期利益。其靈感來源于心理學中的行為主義理論,即有機體如何在環(huán)境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,產生能獲得最大利益的習慣性行為。

image

以上圖為例,強化學習的目標是訓練狗(代理人) 以完成環(huán)境中的任務。首先,訓練員發(fā)出命令或提示,狗會觀察。然后狗通過采取行動做出反應。如果動作接近期望的行為,則培訓師可能會提供獎勵例如食品或玩具。否則,將不會提供任何獎勵或否定的獎勵。在訓練開始時,這只狗可能會采取更多隨機動作,例如在給定命令“坐下”時翻身,因為它試圖將特定的觀察結果與動作和獎勵相關聯(lián)。觀察與動作之間的這種關聯(lián)或映射稱為策略。

從狗的角度來看,理想的情況是對每種提示都能正確做出反應,從而使它得到盡可能多的對待。因此,強化學習訓練的全部含義是調整狗的策略,以便它學習所需的行為,從而最大程度地提高回報。訓練完成后,狗應該能夠觀察主人并采取適當?shù)男袆?,例如,在被命令“坐下”時坐下。

一些理解

  • 監(jiān)督學習訓練數(shù)據(jù)有標簽,無監(jiān)督學習訓練數(shù)據(jù)沒有標簽,強化學習訓練數(shù)據(jù)也沒有標簽,但是可以通過環(huán)境給出的獎懲來學習。
  • 監(jiān)督無監(jiān)督學習的學習過程是靜態(tài)的,強化學習的學習過程是動態(tài)的。這里靜態(tài)動態(tài)的區(qū)別在于是否會與環(huán)境進行交互。
  • 監(jiān)督無監(jiān)督學習解決的更多是類似五官感知問題強化學習解決的更多是類似大腦決策類問題。

深度學習

深度學習是機器學習的一個分支領域,是從數(shù)據(jù)中學習表示的一種新方法。深度學習強調從連續(xù)的層(layer)中進行學習,這些層對應于越來越有意義的表示。

深度學習中的深度指的并不是利用這種方法所獲取的更深層次的理解,而是指一系列連續(xù)的表示層。數(shù)據(jù)模型中包含多少層,這被稱為模型的深度(depth)。

在深度學習中,這些分層表示幾乎總是通過叫作神經網(wǎng)絡(Neural Network) 的模型來學習得到的。神經網(wǎng)絡的結構是逐層堆疊。

下圖為手寫體數(shù)字識別 MNIST的神經網(wǎng)絡

image
image

這個神經網(wǎng)絡將數(shù)字圖像轉換成與原始圖像差別越來越大的表示,而其中關于最終結果的信息卻越來越豐富。你可以將深度網(wǎng)絡看作多級信息蒸餾操作:信息穿過連續(xù)的過濾器,其純度越來越高(即對任務的幫助越來越大)。

這就是深度學習的技術定義:學習數(shù)據(jù)表示的多級方法。這個想法很簡單,但事實證明,非常簡單的機制如果具有足夠大的規(guī)模,將會產生魔法般的效果。

現(xiàn)在看不懂圖中的表示不要緊,后續(xù)章節(jié)會逐步講解。

遷移學習

遷移學習是屬于機器學習的一種研究領域。它專注于存儲已有問題的解決模型,并將其利用在其他不同但相關問題上。考慮到大部分數(shù)據(jù)或任務是存在相關性的,所以通過遷移學習我們可以將已經學到的模型參數(shù)(知識)通過某種方式來分享給新模型從而加快并優(yōu)化模型的學習效率不用像大多數(shù)網(wǎng)絡那樣從零學習 (Starting From Scratch)

比如說,用來辨識汽車的模型也可以被用來提升識別卡車的能力。

image

聯(lián)邦學習

數(shù)據(jù)是機器學習的基礎。而在大多數(shù)行業(yè)中,由于行業(yè)競爭、隱私安全、行政手續(xù)復雜等問題,數(shù)據(jù)常常是以孤島的形式存在的。甚至即使是在同一個公司的不同部門之間實現(xiàn)數(shù)據(jù)集中整合也面臨著重重阻力。在現(xiàn)實中想要將分散在各地、各個機構的數(shù)據(jù)進行整合幾乎是不可能的,或者說所需的成本是巨大的。隨著人工智能的進一步發(fā)展,重視數(shù)據(jù)隱私和安全已經成為了世界性的趨勢。各國都在加強對數(shù)據(jù)安全和隱私的保護,比如歐盟的法案《通用數(shù)據(jù)保護條例》(GDPR)。

針對數(shù)據(jù)孤島數(shù)據(jù)隱私的兩難問題,聯(lián)邦學習便誕生了。聯(lián)邦學習是一個機器學習框架,能有效幫助多個機構滿足用戶隱私保護、數(shù)據(jù)安全和政府法規(guī)的要求下,進行數(shù)據(jù)使用機器學習建模。所以,聯(lián)邦學習本質上是一種分布式機器學習技術,或機器學習框架。

13.jpg

概念間的關系

下圖為人工智能相關概念的關系圖:

image

產業(yè)生態(tài)

理解了人工智能的基本概念后,接著,我們再來看下人工智能的產業(yè)生態(tài)是什么樣的。從全局的視角來了解整個行業(yè),有助于我們知識體系的建立

人工智能產業(yè),從產業(yè)鏈的上下游關系,可以分為基礎層技術層應用層。

image

基礎層

基礎層按照服務的線條被劃分成芯片服務、云服務、機器學習平臺數(shù)據(jù)服務等,它們都是整個 AI 行業(yè)最底層服務提供者;

在基礎層,訊飛的開放平臺、百度大腦、騰訊云是我們接觸比較多的機器學習平臺,阿里云、百度云是做得比較好的云服務提供商。

技術層

在技術層,按照技術類別分為計算機視覺、語音識別自然語言處理、知識圖譜等;

在技術層,有我們熟悉的“視覺四小龍”(商湯、依圖、云從、曠視),主要是提供計算機視覺服務,最常見的應用場景就是人臉識別了;還有科大訊飛、云知聲、思必馳等,主要提供語音識別、語音合成、語音分析等服務。

應用層

在應用層,按行業(yè)分為零售、金融、教育、工業(yè)、互聯(lián)網(wǎng)、醫(yī)療、安防、政務、交通、自主無人系統(tǒng)等;

在應用層,有我們熟悉些大疆無人機、京東的零售、滴滴打車服務、字節(jié)跳動的頭條推薦等。

全鏈服務

除了以上講的幾個層,在整個 AI 產業(yè)生態(tài)中,BAT 等大廠還提供了全鏈條的服務,它們既做了最底層的基礎服務,比如云服務、機器學習平臺;也做技術層,比如 BAT 也有自家的計算機視覺、語音識別等能力;同時,它們也有應用層的整套方案,比如百度大腦

小結

本文是專欄的開篇,本專欄旨在用人話講 AI。因此,如果大家看到不通俗易懂的可以留言,筆者將不斷改進文章的表述,幫助大家更好地了解 AI。

參考

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 隨著近幾年人工神經網(wǎng)絡模型的突破,讓人工智能開始走出實驗室,邁向商業(yè)。 隨著商業(yè),資本,政策,媒體等開始密集的關注...
    theFullHorizon閱讀 435評論 0 0
  • 一、智能行業(yè)綜述 1、AI的描述 AI是指使用機器代替人類實現(xiàn)感知、認知、分析、決策等功能,本質是對人的意識思維與...
    放飛人夜閱讀 1,809評論 2 17
  • 人工智能(英語:Artificial Intelligence,縮寫為AI),就是研究如何使計算機去做過去只有人才...
    小伙車閱讀 942評論 0 1
  • [更新中...]---------------------------------Reference-------...
    chuuuing閱讀 868評論 0 0
  • 本系列文章原文發(fā)布于Github,感謝Star,歡迎Fork與PR。GitBook提供了更好的閱讀體驗。在知乎專欄...
    lonelygo閱讀 866評論 2 1

友情鏈接更多精彩內容