2022-07-05西瓜書1

機(jī)器學(xué)習(xí)

最近二十多年興起的一門多領(lǐng)域交叉學(xué)科?涉及概率論?統(tǒng)計(jì)學(xué)逼近論?凸分析??算法復(fù)雜度理論等多門學(xué)科機(jī)器學(xué)習(xí)理論主要是設(shè)計(jì)和分析一些讓計(jì)算機(jī)可以自動學(xué)習(xí)的算法及從數(shù)據(jù)中自動分析獲得規(guī)律并利用規(guī)律對未知數(shù)據(jù)進(jìn)行預(yù)測的算法

機(jī)器學(xué)習(xí)是基于歷史經(jīng)驗(yàn)的描述和預(yù)測的理論?方法和算法

機(jī)器學(xué)習(xí)的算法主要分為兩部分。一部分是?監(jiān)督學(xué)習(xí)?包括統(tǒng)計(jì)分類、?回歸分析。另一部分?是無監(jiān)督學(xué)習(xí)??聚類、關(guān)聯(lián)規(guī)則

監(jiān)督學(xué)習(xí):數(shù)據(jù)集中的每個(gè)樣本有相應(yīng)的正確答案

分類:模型識別、圖像、字符?、文本識別?人臉識別?語音識別?醫(yī)學(xué)診斷

回歸:線性回歸?非線性回歸

?泛化能力:

機(jī)器學(xué)習(xí)的主要挑戰(zhàn)在于在未見過的數(shù)據(jù)輸入上表現(xiàn)良好?

誤差:學(xué)習(xí)器實(shí)際預(yù)測輸出與樣本真實(shí)輸出之間的差異?包括訓(xùn)練誤差和泛化誤差。我們希望泛化誤差小的學(xué)習(xí)器

過擬合 :訓(xùn)練過度使泛化能力下降? ? ? ? 欠擬合 :未能學(xué)好訓(xùn)練樣本的普遍規(guī)律。過擬合?是機(jī)器學(xué)習(xí)的關(guān)鍵障礙?且不可避免

學(xué)習(xí)器泛化評估實(shí)驗(yàn)測試訓(xùn)練集與測試集組成數(shù)據(jù)集。測試集與訓(xùn)練集互斥。

假設(shè)測試樣本是從真實(shí)分布中采樣而得?避免因數(shù)據(jù)劃分引入偏差

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容