久草男人av天堂,亚洲精品熟女一二区

上節(jié)課，我們主要介紹了機(jī)器學(xué)習(xí)的可行性。首先，由NFL定理可知，機(jī)器學(xué)習(xí)貌似是不可行的。但是，隨后引入了統(tǒng)計學(xué)知識，如果樣本數(shù)據(jù)足夠大，且hypothesis個數(shù)有限，那么機(jī)器學(xué)習(xí)一般就是可行的。本節(jié)課將討論機(jī)器學(xué)習(xí)的核心問題，嚴(yán)格證明為什么機(jī)器可以學(xué)習(xí)。從上節(jié)課最后的問題出發(fā)，即當(dāng)hypothesis的個數(shù)是無限多的時候，機(jī)器學(xué)習(xí)的可行性是否仍然成立？

一、Recap and Preview

我們先來看一下基于統(tǒng)計學(xué)的機(jī)器學(xué)習(xí)流程圖：

該流程圖中，訓(xùn)練樣本D和最終測試h的樣本都是來自同一個數(shù)據(jù)分布，這是機(jī)器能夠?qū)W習(xí)的前提。另外，訓(xùn)練樣本D應(yīng)該足夠大，且hypothesis set的個數(shù)是有限的，這樣根據(jù)霍夫丁不等式，才不會出現(xiàn)Bad Data，保證Ein≈Eout，即有很好的泛化能力。同時，通過訓(xùn)練，得到使Ein最小的h，作為模型最終的矩g，g接近于目標(biāo)函數(shù)。

這里，我們總結(jié)一下前四節(jié)課的主要內(nèi)容：第一節(jié)課，我們介紹了機(jī)器學(xué)習(xí)的定義，目標(biāo)是找出最好的矩g，使g≈f，保證Eout(g)≈0；第二節(jié)課，我們介紹了如何讓Ein≈0，可以使用PLA、pocket等演算法來實現(xiàn)；第三節(jié)課，我們介紹了機(jī)器學(xué)習(xí)的分類，我們的訓(xùn)練樣本是批量數(shù)據(jù)（batch），處理監(jiān)督式（supervised）二元分類（binary classification）問題；第四節(jié)課，我們介紹了機(jī)器學(xué)習(xí)的可行性，通過統(tǒng)計學(xué)知識，把Ein(g)與Eout(g)聯(lián)系起來，證明了在一些條件假設(shè)下，Ein(g)≈Eout(g)成立。

這四節(jié)課總結(jié)下來，我們把機(jī)器學(xué)習(xí)的主要目標(biāo)分成兩個核心的問題：

1、Ein(g)≈Eout(g)

2、Ein(g)足夠小

上節(jié)課介紹的機(jī)器學(xué)習(xí)可行的一個條件是hypothesis set的個數(shù)M是有限的，那M跟上面這兩個核心問題有什么聯(lián)系呢？

我們先來看一下，當(dāng)M很小的時候，由上節(jié)課介紹的霍夫丁不等式，得到Ein(g)≈Eout(g)，即能保證第一個核心問題成立。但M很小時，演算法A可以選擇的hypothesis有限，不一定能找到使Ein(g)足夠小的hypothesis，即不能保證第二個核心問題成立。當(dāng)M很大的時候，同樣由霍夫丁不等式，Ein(g)與Eout(g)的差距可能比較大，第一個核心問題可能不成立。而M很大，使的演算法A的可以選擇的hypothesis就很多，很有可能找到一個hypothesis，使Ein(g)足夠小，第二個核心問題可能成立。

從上面的分析來看，M的選擇直接影響機(jī)器學(xué)習(xí)兩個核心問題是否滿足，M不能太大也不能太小。那么如果M無限大的時候，是否機(jī)器就不可以學(xué)習(xí)了呢？例如PLA算法中直線是無數(shù)條的，但是PLA能夠很好地進(jìn)行機(jī)器學(xué)習(xí)，這又是為什么呢？如果我們能將無限大的M限定在一個有限的mH內(nèi)，問題似乎就解決了。

二、Effective Number of Line

我們先看一下上節(jié)課推導(dǎo)的霍夫丁不等式：

其中，M表示hypothesis的個數(shù)。每個hypothesis下的BAD eventsBm級聯(lián)的形式滿足下列不等式：

當(dāng)M=∞時，上面不等式右邊值將會很大，似乎說明BAD events很大，Ein(g)與Eout(g)也并不接近。但是BAD eventsBm級聯(lián)的形式實際上是擴(kuò)大了上界，union bound過大。這種做法假設(shè)各個hypothesis之間沒有交集，這是最壞的情況，可是實際上往往不是如此，很多情況下，都是有交集的，也就是說M實際上沒那么大，如下圖所示：

也就是說union bound被估計過高了（over-estimating）。所以，我們的目的是找出不同BAD events之間的重疊部分，也就是將無數(shù)個hypothesis分成有限個類別。

如何將無數(shù)個hypothesis分成有限類呢？我們先來看這樣一個例子，假如平面上用直線將點(diǎn)分開，也就跟PLA一樣。如果平面上只有一個點(diǎn)x1，那么直線的種類有兩種：一種將x1劃為+1，一種將x1劃為-1：

如果平面上有兩個點(diǎn)x1、x2，那么直線的種類共4種：x1、x2都為+1，x1、x2都為-1，x1為+1且x2為-1，x1為-1且x2為+1：

如果平面上有三個點(diǎn)x1、x2、x3，那么直線的種類共8種：

但是，在三個點(diǎn)的情況下，也會出現(xiàn)不能用一條直線劃分的情況：

也就是說，對于平面上三個點(diǎn)，不能保證所有的8個類別都能被一條直線劃分。那如果是四個點(diǎn)x1、x2、x3、x4，我們發(fā)現(xiàn)，平面上找不到一條直線能將四個點(diǎn)組成的16個類別完全分開，最多只能分開其中的14類，即直線最多只有14種：

經(jīng)過分析，我們得到平面上線的種類是有限的，1個點(diǎn)最多有2種線，2個點(diǎn)最多有4種線，3個點(diǎn)最多有8種線，4個點(diǎn)最多有14（<24）種線等等。我們發(fā)現(xiàn)，有效直線的數(shù)量總是滿足≤2N，其中，N是點(diǎn)的個數(shù)。所以，如果我們可以用effective(N)代替M，霍夫丁不等式可以寫成：

已知effective(N)<2的N次方，如果能夠保證effective(N)<<2的N次方，即不等式右邊接近于零，那么即使M無限大，直線的種類也很有限，機(jī)器學(xué)習(xí)也是可能的。

三、Effective Number of Hypotheses

接下來先介紹一個新名詞：二分類（dichotomy）。dichotomy就是將空間中的點(diǎn)（例如二維平面）用一條直線分成正類（藍(lán)色o）和負(fù)類（紅色x）。令H是將平面上的點(diǎn)用直線分開的所有hypothesis h的集合，dichotomy H與hypotheses H的關(guān)系是：hypotheses H是平面上所有直線的集合，個數(shù)可能是無限個，而dichotomy H是平面上能將點(diǎn)完全用直線分開的直線種類，它的上界是2N。接下來，我們要做的就是嘗試用dichotomy代替M。

再介紹一個新的名詞：成長函數(shù)（growth function），記為mH(H)。成長函數(shù)的定義是：對于由N個點(diǎn)組成的不同集合中，某集合對應(yīng)的dichotomy最大，那么這個dichotomy值就是mH(H)，它的上界是2N：

成長函數(shù)其實就是我們之前講的effective lines的數(shù)量最大值。根據(jù)成長函數(shù)的定義，二維平面上，mH(H)隨N的變化關(guān)系是：

接下來，我們討論如何計算成長函數(shù)。先看一個簡單情況，一維的Positive Rays：

若有N個點(diǎn)，則整個區(qū)域可分為N+1段，很容易得到其成長函數(shù)mH(N)=N+1。注意當(dāng)N很大時，(N+1)<<2N，這是我們希望看到的。

另一種情況是一維的Positive Intervals：

它的成長函數(shù)可以由下面推導(dǎo)得出：

這種情況下，mH(N)<<2N，在N很大的時候，仍然是滿足的。

再來看這個例子，假設(shè)在二維空間里，如果hypothesis是凸多邊形或類圓構(gòu)成的封閉曲線，如下圖所示，左邊是convex的，右邊不是convex的。那么，它的成長函數(shù)是多少呢？

當(dāng)數(shù)據(jù)集D按照如下的凸分布時，我們很容易計算得到它的成長函數(shù)mH=2N。這種情況下，N個點(diǎn)所有可能的分類情況都能夠被hypotheses set覆蓋，我們把這種情形稱為shattered。也就是說，如果能夠找到一個數(shù)據(jù)分布集，hypotheses set對N個輸入所有的分類情況都做得到，那么它的成長函數(shù)就是2N。

四、Break Point

上一小節(jié)，我們介紹了四種不同的成長函數(shù)，分別是：

其中，positive rays和positive intervals的成長函數(shù)都是polynomial的，如果用mH代替M的話，這兩種情況是比較好的。而convex sets的成長函數(shù)是exponential的，即等于M，并不能保證機(jī)器學(xué)習(xí)的可行性。那么，對于2D perceptrons，它的成長函數(shù)究竟是polynomial的還是exponential的呢？

對于2D perceptrons，我們之前分析了3個點(diǎn)，可以做出8種所有的dichotomy，而4個點(diǎn)，就無法做出所有16個點(diǎn)的dichotomy了。所以，我們就把4稱為2D perceptrons的break point（5、6、7等都是break point）。令有k個點(diǎn)，如果k大于等于break point時，它的成長函數(shù)一定小于2的k次方。

根據(jù)break point的定義，我們知道滿足mH(k)≠2k的k的最小值就是break point。對于我們之前介紹的四種成長函數(shù)，他們的break point分別是：

通過觀察，我們猜測成長函數(shù)可能與break point存在某種關(guān)系：對于convex sets，沒有break point，它的成長函數(shù)是2的N次方；對于positive rays，break point k=2，它的成長函數(shù)是O(N)；對于positive intervals，break point k=3，它的成長函數(shù)是O(N2)。則根據(jù)這種推論，我們猜測2D perceptrons，它的成長函數(shù)mH(N)=O(Nk?1)。如果成立，那么就可以用mH代替M，就滿足了機(jī)器能夠?qū)W習(xí)的條件。關(guān)于上述猜測的證明，我們下節(jié)課再詳細(xì)介紹。

五、總結(jié)

本節(jié)課，我們更深入地探討了機(jī)器學(xué)習(xí)的可行性。我們把機(jī)器學(xué)習(xí)拆分為兩個核心問題：Ein(g)≈Eout(g)和Ein(g)≈0。對于第一個問題，我們探討了M個hypothesis到底可以劃分為多少種，也就是成長函數(shù)mH。并引入了break point的概念，給出了break point的計算方法。下節(jié)課，我們將詳細(xì)論證對于2D perceptrons，它的成長函數(shù)與break point是否存在多項式的關(guān)系，如果是這樣，那么機(jī)器學(xué)習(xí)就是可行的。

原文CSDN博客地址：

臺灣大學(xué)林軒田機(jī)器學(xué)習(xí)基石課程學(xué)習(xí)筆記5 -- Training versus Testing

注明：

文章中所有的圖片均來自臺灣大學(xué)林軒田《機(jī)器學(xué)習(xí)基石》課程。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

臺灣大學(xué)林軒田機(jī)器學(xué)習(xí)基石課程學(xué)習(xí)筆記5 -- Training versus Testing

臺灣大學(xué)林軒田機(jī)器學(xué)習(xí)基石課程學(xué)習(xí)筆記5 -- Training versus Testing

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

臺灣大學(xué)林軒田機(jī)器學(xué)習(xí)基石課程學(xué)習(xí)筆記5 -- Training versus Testing

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av