機(jī)器學(xué)習(xí)
最近二十多年興起的一門多領(lǐng)域交叉學(xué)科?涉及概率論?統(tǒng)計(jì)學(xué)逼近論?凸分析??算法復(fù)雜度理論等多門學(xué)科機(jī)器學(xué)習(xí)理論主要是設(shè)計(jì)和分析一些讓計(jì)算機(jī)可以自動學(xué)習(xí)的算法及從數(shù)據(jù)中自動分析獲得規(guī)律并利用規(guī)律對未知數(shù)據(jù)進(jìn)行預(yù)測的算法
機(jī)器學(xué)習(xí)是基于歷史經(jīng)驗(yàn)的描述和預(yù)測的理論?方法和算法
機(jī)器學(xué)習(xí)的算法主要分為兩部分。一部分是?監(jiān)督學(xué)習(xí)?包括統(tǒng)計(jì)分類、?回歸分析。另一部分?是無監(jiān)督學(xué)習(xí)??聚類、關(guān)聯(lián)規(guī)則
監(jiān)督學(xué)習(xí):數(shù)據(jù)集中的每個(gè)樣本有相應(yīng)的正確答案
分類:模型識別、圖像、字符?、文本識別?人臉識別?語音識別?醫(yī)學(xué)診斷
回歸:線性回歸?非線性回歸
?泛化能力:
機(jī)器學(xué)習(xí)的主要挑戰(zhàn)在于在未見過的數(shù)據(jù)輸入上表現(xiàn)良好?
誤差:學(xué)習(xí)器實(shí)際預(yù)測輸出與樣本真實(shí)輸出之間的差異?包括訓(xùn)練誤差和泛化誤差。我們希望泛化誤差小的學(xué)習(xí)器
過擬合 :訓(xùn)練過度使泛化能力下降? ? ? ? 欠擬合 :未能學(xué)好訓(xùn)練樣本的普遍規(guī)律。過擬合?是機(jī)器學(xué)習(xí)的關(guān)鍵障礙?且不可避免
學(xué)習(xí)器泛化評估實(shí)驗(yàn)測試訓(xùn)練集與測試集組成數(shù)據(jù)集。測試集與訓(xùn)練集互斥。
假設(shè)測試樣本是從真實(shí)分布中采樣而得?避免因數(shù)據(jù)劃分引入偏差