臺(tái)灣大學(xué)林軒田機(jī)器學(xué)習(xí)(1)---The Learning Problem

最近在看NTU林軒田的《機(jī)器學(xué)習(xí)基石》課程,整個(gè)基石課程分成四個(gè)部分:

  • When Can Machine Learn?

  • Why Can Machine Learn?

  • How Can Machine Learn?

  • How Can Machine Learn Better?

每個(gè)部分由四節(jié)課組成,總共有16節(jié)課。那么,從這篇開(kāi)始,我們將連續(xù)對(duì)這門課做課程筆記,共16篇,希望能對(duì)正在看這們課的童鞋有所幫助。下面開(kāi)始第一節(jié)課的筆記:The Learning Problem。

一、What is Machine Learning

什么是“學(xué)習(xí)”?學(xué)習(xí)就是人類通過(guò)觀察、積累經(jīng)驗(yàn),掌握某項(xiàng)技能或能力。就好像我們從小學(xué)習(xí)識(shí)別字母、認(rèn)識(shí)漢字,就是學(xué)習(xí)的過(guò)程。而機(jī)器學(xué)習(xí)(Machine Learning),顧名思義,就是讓機(jī)器(計(jì)算機(jī))也能向人類一樣,通過(guò)觀察大量的數(shù)據(jù)和訓(xùn)練,發(fā)現(xiàn)事物規(guī)律,獲得某種分析問(wèn)題、解決問(wèn)題的能力。

image.png

機(jī)器學(xué)習(xí)可以被定義為:Improving some performance measure with experence computed from data. 也就是機(jī)器從數(shù)據(jù)中總結(jié)經(jīng)驗(yàn),從數(shù)據(jù)中找出某種規(guī)律或者模型,并用它來(lái)解決實(shí)際問(wèn)題。
image.png

什么情況下會(huì)使用機(jī)器學(xué)習(xí)來(lái)解決問(wèn)題呢?其實(shí),目前機(jī)器學(xué)習(xí)的應(yīng)用非常廣泛,基本上任何場(chǎng)合都能夠看到它的身影。其應(yīng)用場(chǎng)合大致可歸納為三個(gè)條件:

  • 事物本身存在某種潛在規(guī)律

  • 某些問(wèn)題難以使用普通編程解決

  • 有大量的數(shù)據(jù)樣本可供使用


    image.png

二、Applications of Machine Learning

機(jī)器學(xué)習(xí)在我們的衣、食、住、行、教育、娛樂(lè)等各個(gè)方面都有著廣泛的應(yīng)用,我們的生活處處都離不開(kāi)機(jī)器學(xué)習(xí)。比如,打開(kāi)購(gòu)物網(wǎng)站,網(wǎng)站就會(huì)給我們自動(dòng)推薦我們可能會(huì)喜歡的商品;電影頻道會(huì)根據(jù)用戶的瀏覽記錄和觀影記錄,向不同用戶推薦他們可能喜歡的電影等等,到處都有機(jī)器學(xué)習(xí)的影子。

三、Components of Machine Learning

本系列的課程對(duì)機(jī)器學(xué)習(xí)問(wèn)題有一些基本的術(shù)語(yǔ)需要注意一下:

  • 輸入x

  • 輸出y

  • 目標(biāo)函數(shù)f,即最接近實(shí)際樣本分布的規(guī)律

  • 訓(xùn)練樣本data

  • 假設(shè)hypothesis,一個(gè)機(jī)器學(xué)習(xí)模型對(duì)應(yīng)了很多不同的hypothesis,通過(guò)演算法A,選擇一個(gè)最佳的hypothesis對(duì)應(yīng)的函數(shù)稱為矩g,g能最好地表示事物的內(nèi)在規(guī)律,也是我們最終想要得到的模型表達(dá)式。


    image.png

    實(shí)際中,機(jī)器學(xué)習(xí)的流程圖可以表示為:

這里寫圖片描述

對(duì)于理想的目標(biāo)函數(shù)f,我們是不知道的,我們手上拿到的是一些訓(xùn)練樣本D,假設(shè)是監(jiān)督式學(xué)習(xí),其中有輸入x,也有輸出y。機(jī)器學(xué)習(xí)的過(guò)程,就是根據(jù)先驗(yàn)知識(shí)選擇模型,該模型對(duì)應(yīng)的hypothesis set(用H表示),H中包含了許多不同的hypothesis,通過(guò)演算法A,在訓(xùn)練樣本D上進(jìn)行訓(xùn)練,選擇出一個(gè)最好的hypothes,對(duì)應(yīng)的函數(shù)表達(dá)式g就是我們最終要求的。一般情況下,g能最接近目標(biāo)函數(shù)f,這樣,機(jī)器學(xué)習(xí)的整個(gè)流程就完成了。

四、Machine Learning and Other Fields

與機(jī)器學(xué)習(xí)相關(guān)的領(lǐng)域有:

  • 數(shù)據(jù)挖掘(Data Mining)

  • 人工智能(Artificial Intelligence)

  • 統(tǒng)計(jì)(Statistics)
    其實(shí),機(jī)器學(xué)習(xí)與這三個(gè)領(lǐng)域是相通的,基本類似,但也不完全一樣。機(jī)器學(xué)習(xí)是這三個(gè)領(lǐng)域中的有力工具,而同時(shí),這三個(gè)領(lǐng)域也是機(jī)器學(xué)習(xí)可以廣泛應(yīng)用的領(lǐng)域,總得來(lái)說(shuō),他們之間沒(méi)有十分明確的界線。

五、總結(jié)

本節(jié)課主要介紹了什么是機(jī)器學(xué)習(xí),什么樣的場(chǎng)合下可以使用機(jī)器學(xué)習(xí)解決問(wèn)題,然后用流程圖的形式展示了機(jī)器學(xué)習(xí)的整個(gè)過(guò)程,最后把機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘、人工智能、統(tǒng)計(jì)這三個(gè)領(lǐng)域做個(gè)比較。本節(jié)課的內(nèi)容主要是概述性的東西,比較簡(jiǎn)單,所以筆記也相對(duì)比較簡(jiǎn)略。

這里附上林軒田(Hsuan-Tien Lin)關(guān)于這門課的主頁(yè):
http://www.csie.ntu.edu.tw/~htlin/

注明:

文章中所有的圖片均來(lái)自臺(tái)灣大學(xué)林軒田《機(jī)器學(xué)習(xí)基石》課程。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容