李航統(tǒng)計學(xué)習(xí)方法(一)

1、特點(diǎn)

  • 統(tǒng)計學(xué)習(xí)以數(shù)據(jù)為研究對象(數(shù)據(jù)驅(qū)動),以方法為中心,目的是為了對數(shù)據(jù)進(jìn)行預(yù)測與分析。

2、方法

  • 統(tǒng)計學(xué)習(xí)包括監(jiān)督學(xué)習(xí),非監(jiān)督學(xué)習(xí),半監(jiān)督學(xué)習(xí),強(qiáng)化學(xué)習(xí)。(以監(jiān)督學(xué)習(xí)為主進(jìn)行介紹)

  • 統(tǒng)計學(xué)習(xí)的方法包括模型的假設(shè)空間、模型選擇的準(zhǔn)則以及模型學(xué)習(xí)的方法。

  • 統(tǒng)計學(xué)習(xí)方法三要素:模型,策略,算法

統(tǒng)計學(xué)習(xí)方法步驟:
  • 得到一個有限訓(xùn)練數(shù)據(jù)集
  • 確定包含所有可能的模型假設(shè)空間,即學(xué)習(xí)模型的集合
  • 確定模型選擇的準(zhǔn)則,即學(xué)習(xí)的策略
  • 實(shí)現(xiàn)求解最優(yōu)模型的算法,即學(xué)習(xí)的方法
  • 通過學(xué)習(xí)方法選擇最優(yōu)模型
  • 利用學(xué)習(xí)的最優(yōu)模型對新數(shù)據(jù)進(jìn)行預(yù)測與分析

監(jiān)督學(xué)習(xí)

其任務(wù)是學(xué)習(xí)一個模型,使模型能夠?qū)τ谌我饨o定的輸入,對其對用的輸出做出一個好的預(yù)測(此處的輸入輸出為系統(tǒng)的輸入輸出,與學(xué)習(xí)的輸入輸出不同)


image.png

模型

統(tǒng)計學(xué)習(xí)首要考慮的問題是學(xué)習(xí)什么樣的模型,接著考慮按照什么樣的準(zhǔn)則學(xué)習(xí)或選擇最優(yōu)的模型。

策略:用經(jīng)驗(yàn)風(fēng)險估計期望風(fēng)險。經(jīng)驗(yàn)風(fēng)險是模型關(guān)于訓(xùn)練樣本集的平均損失,期望風(fēng)險是模型關(guān)于聯(lián)合分布的期望損失。但是經(jīng)驗(yàn)風(fēng)險估計期望風(fēng)險往往不理想,要對經(jīng)驗(yàn)風(fēng)險進(jìn)行矯正,這關(guān)系到監(jiān)督學(xué)習(xí)的兩個基本策略:經(jīng)驗(yàn)風(fēng)險最小化和結(jié)構(gòu)風(fēng)險最小化。


image.png
image.png

模型評估與選擇

方法:正則化和交叉驗(yàn)證

正則化:在經(jīng)驗(yàn)風(fēng)險上加正則化項(xiàng)


image.png

交叉驗(yàn)證(在數(shù)據(jù)不充足時使用):

  • 當(dāng)數(shù)據(jù)充足時,將數(shù)據(jù)隨機(jī)分為訓(xùn)練集(訓(xùn)練模型)、驗(yàn)證集(選擇模型)、測試集(評估最終的學(xué)習(xí)方法),選擇對驗(yàn)證集有最小預(yù)測誤差的模型。數(shù)據(jù)不充足時用交叉驗(yàn)證,基本思想為重復(fù)利用數(shù)據(jù)。

泛化能力

  • 泛化誤差是所學(xué)習(xí)到的模型的期望誤差。

  • 泛化誤差上界:通過比較兩種學(xué)習(xí)方法的泛化誤差上界的大小來比較優(yōu)劣。泛化誤差上界有以下性質(zhì):它是樣本容量的函數(shù),當(dāng)樣本容量增加時,泛化誤差上界趨于0;它是假設(shè)空間容量的函數(shù),假設(shè)空間容量越大,模型越難學(xué),泛化誤差上界就越大。

生成模型與判別模型

生成模型


image.png

判別模型


image.png

分類

分類是監(jiān)督學(xué)習(xí)的一個核心問題。當(dāng)輸出變量去有限個離散值是,預(yù)測問題便成為分類問題(輸入可以是離散的也可以是連續(xù)的)

分類問題分為學(xué)習(xí)和分類兩個過程


image.png

標(biāo)注

image.png

image.png

回歸

回歸用于預(yù)測輸入變量與輸出變量之間的關(guān)系,特別是當(dāng)輸入變量的值發(fā)生變化時,輸出變量是值隨之發(fā)生的變化。分為學(xué)習(xí)和預(yù)測兩個過程


#
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容