本文由 沈慶陽 所有,轉(zhuǎn)載請與作者取得聯(lián)系!
前言
隨著計算機計算能力和數(shù)據(jù)量的不斷增長,人工智能在近些年以近乎爆炸似的速度進行增長。其中,專家系統(tǒng)、機器學(xué)習(xí)、推薦系統(tǒng)和計算機視覺等人工智能的分支也在不斷擴大。
機器學(xué)習(xí)是人工智能中的一個重要工具,機器學(xué)習(xí)能夠幫助我們解讀一連串或是離散的數(shù)據(jù)的含義。對于機器學(xué)習(xí),我們不需要硬編碼(HardCode),而只需向程序提供足夠多的樣本,即可得到可以達到目的的自己想要的程序。比如我們在前幾章中可以使用相同的程序,不同的樣本來訓(xùn)練程序識別不同的物體,甚至是不同的動物,而不需要改變程序的任何代碼。
本節(jié)關(guān)鍵詞
標(biāo)簽(Label)、特征(Feature)、樣本(Example)、模型(Model)、回歸(Regression)、分類(Classification)、訓(xùn)練(Train)、損失(Loss)
機器學(xué)習(xí)的框架
機器學(xué)習(xí)的定義如下:
·機器學(xué)習(xí)系統(tǒng)通過學(xué)習(xí)如何組合輸入信息來對從未見過的數(shù)據(jù)做出有用的預(yù)測。
也許通過前幾節(jié)的練習(xí),我們對機器學(xué)習(xí)的定義有了一些了解。
標(biāo)簽
在離散數(shù)學(xué)的學(xué)習(xí)中,我們學(xué)過簡單的線性回歸(Simple Linear Regression)。比如,成都市平均房價與房屋面積的關(guān)系、一個餐館的銷售額與周圍學(xué)校大學(xué)生的數(shù)量等。我們要通過房屋面積來預(yù)測房價,要通過大學(xué)生的數(shù)量來預(yù)測餐館的銷售額。那么在上述問題中,要預(yù)測的變量為y(房價與銷售額),即標(biāo)簽。標(biāo)簽可以是房屋未來的價格、圖片中顯示的物體是什么、音頻文件的含義或任何事物。
因此,標(biāo)簽即要預(yù)測的事物,用y表示。
特征
在上一段介紹的情境中,我們根據(jù)房屋面積和學(xué)生數(shù)量來預(yù)測事物,這些根據(jù)的信息即為特征。進一步地解釋來說,特征即輸入變量,用x表示。對于一些簡單的機器學(xué)習(xí)來說,特征可能僅有一個。但是對于復(fù)雜的機器學(xué)習(xí)問題來說,可能有上萬個特征。用{x1,x2,x3...xn}來表示這些特征。
樣本
樣本分為有標(biāo)簽樣本和無標(biāo)簽樣本。
有標(biāo)簽樣本包含著特征和標(biāo)簽,其定義形式如下:
有標(biāo)簽樣本: {特征, 標(biāo)簽}: (x, y)
樣本是一個矢量,我們使用有標(biāo)簽樣本來訓(xùn)練機器學(xué)習(xí)程序。
無標(biāo)簽樣本包含特征,但不包含標(biāo)簽,其定時形式如下:
無標(biāo)簽樣本: {特征, ?}: (x, ?)
在通過使用有標(biāo)簽的樣本來訓(xùn)練好我們的機器學(xué)習(xí)程序之后,我們可以使用機器學(xué)習(xí)程序來預(yù)測無標(biāo)簽樣本,從而得到相應(yīng)的預(yù)測的標(biāo)簽。
模型
模型,即特征和標(biāo)簽之間的關(guān)系。在數(shù)學(xué)中,我們通常使用函數(shù)或是映射來表示x和y的關(guān)系。而在機器學(xué)習(xí)領(lǐng)域中,這種關(guān)系則被稱作模型。
模型的誕生通常分為2個階段。首先是訓(xùn)練模型,即創(chuàng)建和學(xué)習(xí)模型。通過訓(xùn)練模型我們可以創(chuàng)建出一個模型。通過給機器學(xué)習(xí)程序給予足夠的有標(biāo)簽樣本(特征和標(biāo)簽的集合),模型逐漸學(xué)習(xí)其中特征和標(biāo)簽的關(guān)系。
當(dāng)模型創(chuàng)建完畢之后,便是推斷。將訓(xùn)練好的模型用于無標(biāo)簽樣本,來預(yù)測相應(yīng)的標(biāo)簽y'。
回歸與分類
回歸模型可用于預(yù)測連續(xù)值,而分類模型可用于預(yù)測離散值。這將在后面進行闡述。
線性回歸
線性回歸(Linear regression)是利用稱為線性回歸方程的最小平方函數(shù)對一個或多個自變量和因變量之間關(guān)系進行建模的一種回歸分析。 這種函數(shù)是一個或多個稱為回歸系數(shù)的模型參數(shù)的線性組合。 只有一個自變量的情況稱為簡單回歸,大于一個自變量情況的叫做多元回歸。

在上圖中,我們假設(shè)其含義為平均房價和房子面積之間的關(guān)系。由前面所講可知,平均房價是我們要預(yù)測的事物,即標(biāo)簽。而房子面積則是特征。
在初中數(shù)學(xué)里,我們可以畫出一條直線,可以在x軸上任取一點,做x軸的垂線,來截取直線上的一點,該點的y值即我們預(yù)測的平均房價。
該直線的方程在幾何學(xué)中以:y=ax+b來表示。
其中:
a為斜率,b為直線在y軸上的截距。
而在機器學(xué)習(xí)中,我們以如下形式表示:
y'=w0+w1x1
其中,y'為我們要預(yù)測的標(biāo)簽,即理想的輸出值、w0指的是偏差、w1指的是特征1的權(quán)重、x1指的是特征即輸入項。
如果具有多個特征,即非簡單線性回歸,則該模型的表示形式如下:
y'=x0+w1x1+w2x2+....wnxn
訓(xùn)練和損失
訓(xùn)練
在監(jiān)督式機器學(xué)習(xí)中,訓(xùn)練指的是通過有標(biāo)簽樣本來學(xué)習(xí),從而得到各個特征的理想的權(quán)重和偏差值。機器學(xué)習(xí)的算法通過結(jié)合所有輸入樣本,找到合適的權(quán)重和偏差值從而使損失最小,即經(jīng)驗風(fēng)險最小化。
損失即對單個樣本而言,模型預(yù)測的準(zhǔn)確程度。以簡單線性回歸為例,如果模型直線直接穿過所有樣本點,則損失為0(基本上是不可能的)。如果模型距離樣本點偏差過大,則損失越大。訓(xùn)練模型則是為了找到損失較小的偏差和權(quán)重。
損失
對于線性回歸而言,其損失函數(shù)為平方損失,即L2損失。
均方誤差指的是每個樣本的平均平方損失。要計算均方差,需要求出各個樣本的所有平方損失之和,然后除以樣本數(shù)量,即:
均方差=(實際值-預(yù)測值)^2 / 樣本數(shù)量
表述為,實際值和預(yù)測值差的平方除以樣本數(shù)量。
在機器學(xué)習(xí)中,不同的模型適用不同的損失函數(shù)。損失函數(shù)的選取對于我們準(zhǔn)確地計算損失極其關(guān)鍵。
覺得寫的不錯的朋友可以點一個 喜歡? ~
謝謝你的支持!