Hung-yi Lee
1.前言
1.1 發(fā)展過(guò)程
人工智能(目標(biāo))1950s? ? 機(jī)器學(xué)習(xí)(方法)1980s? ? 深度學(xué)習(xí)(機(jī)器學(xué)習(xí)的重要方法)2010s

1.2生物的本能
類(lèi)比于程序的if/else(由人類(lèi)設(shè)計(jì)好的程序的本能? ?hand-crafted roles)
weakness of hand-crafted roles:
(1)hard to consider all possibilities
(2)lots of human efforts(not suit for small indstruy)
1.3What is Machine Learning
~Looking for a Function From Data
舉例:
(1)speech recognition(語(yǔ)音識(shí)別)

(2)imagine?recognition

...
其工作的步驟是:第一步定義模型,第二步定義目標(biāo)函數(shù)并訓(xùn)練,第三步選出最優(yōu)模型:


其中,第三步選擇出最優(yōu)的模型則根據(jù)goodness of fit(擬合優(yōu)度)選擇出更好的model。
goodness of fit(擬合優(yōu)度):模型(modle or function set)和訓(xùn)練數(shù)據(jù)(training data)的擬合度。

2.Learning Map


每一種Learning,都包含如上的三個(gè)問(wèn)題(回歸問(wèn)題、分類(lèi)問(wèn)題、結(jié)構(gòu)化問(wèn)題),而這三種問(wèn)題,都可以用線(xiàn)性模型或者非線(xiàn)性模型來(lái)解決。
幾種Learning的選擇,在于所擁有的training Data的特點(diǎn),從而選擇不同的Learning,即根據(jù)不同的scenario,進(jìn)行選擇。
task是指我們?cè)诓煌膕cenario下,所選用的Model的輸出。在Regression中,其function的輸出是一個(gè)scalar,在Classification中,其function的輸出是某一個(gè)class(分類(lèi)),在Structed Learning中,我們要得到的是一個(gè)無(wú)法窮舉的output的一個(gè)子集。
method即function set或稱(chēng)Model,在圖中的意思是:在regression或者classification或者structed learning中,均可以有l(wèi)inear Model或者Non-linear Model。
2.1Regression(回歸問(wèn)題)
The output of the target function f is "scalar" (數(shù)值)。如pm2.5的預(yù)測(cè),輸出一個(gè)預(yù)測(cè)值表示pm2.5,而輸出這樣的“scalar”需要Training Data。

2.2Classification(分類(lèi)問(wèn)題)
需要根據(jù)擬合優(yōu)度選取Model進(jìn)行classification,包括Linear Model和Non-Linear Modle(如Deep Learning等),與liner model相比可以處理更加復(fù)雜的事情,如圖像處理、圍棋等。分為以下兩類(lèi):
(1)Binary Classification(二元分類(lèi)),如:垃圾郵件的辨別,輸入郵件獲得是或者否。
(2)Multi-class Classification,如:新聞的分類(lèi),輸入一篇新聞,獲得這篇新聞的分類(lèi)。
2.3Structured Learning(結(jié)構(gòu)化問(wèn)題)
-“Beyond Classification”(處理非分類(lèi)問(wèn)題)
如語(yǔ)音識(shí)別,輸入聲音信號(hào),output出文字語(yǔ)句,我們無(wú)法窮舉所有的語(yǔ)句。
3.Scenario
幾種Learning的選擇,在于所擁有的training Data的特點(diǎn),從而選擇不同的Learning,即根據(jù)不同的scenario,進(jìn)行選擇。
3.1Supervised Learning:
Supervised Learning需要的Training Data:input/output pair of target function(輸入和function的output也叫做label)
3.2Semi-supervised Learning:
Semi-supervised Learning需要的Training Data:沒(méi)有output的data
3.3Transfer Learning:
Transfer Learning需要的Training Data:有一部分有l(wèi)abel,一部分沒(méi)有l(wèi)abel。
3.4Unsupervised Learning:
3.5Reinforcement Learning
Supervised Learning:含有input和output的training data,可以理解為“Learning from teacher”
Reinforcement Learning:機(jī)器沒(méi)有input和output的function,會(huì)在機(jī)器輸出之后最后得到一個(gè)“評(píng)價(jià)”,并根據(jù)評(píng)價(jià)去嘗試修正?!癓earning from critics”,更接近人類(lèi)學(xué)習(xí)的過(guò)程。
Alpha Go is supervised learning + reinfocement learning,先輸入棋譜,后機(jī)器間進(jìn)行博弈,沒(méi)一句博弈都會(huì)得到一個(gè)評(píng)價(jià),然后機(jī)器根據(jù)評(píng)價(jià)進(jìn)行調(diào)整。