筆記(第一講)

什么是 Machine Learning?


使用Machine Learning 方法的關(guān)鍵:

1, 存在有待學(xué)習(xí)的“隱含模式”

2, 該模式不容易準(zhǔn)確定義(直接通過程序?qū)崿F(xiàn))

3, 存在關(guān)于該模式的足夠數(shù)據(jù)


f 是我們想知道的目標(biāo)函數(shù)(不知道)。A 機(jī)器學(xué)習(xí)的算法(核心) 。X輸入 Y輸出,D資料。

g是我們算出來的最好的假說hypothesis(最好接近于g)。H是假說空間、假說集,g屬于H,通過A選出。

二, 機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘、人工智能、統(tǒng)計(jì)學(xué)的關(guān)系

1, Machine Learning vs. Data Mining

數(shù)據(jù)挖掘是利用(大量的)數(shù)據(jù)來發(fā)現(xiàn)有趣的性質(zhì)。

1.1 如果這里的”有趣的性質(zhì)“剛好和我們要求解的假設(shè)相同,那么ML=DM。

1.2 如果”有趣的性質(zhì)“和我們要求的假設(shè)相關(guān),那么數(shù)據(jù)挖掘能夠幫助機(jī)器學(xué)習(xí)的任務(wù),反過來,機(jī)器學(xué)習(xí)也有可能幫助挖掘(不一定)。

1.3 傳統(tǒng)的數(shù)據(jù)挖掘關(guān)注如果在大規(guī)模數(shù)據(jù)(數(shù)據(jù)庫)上的運(yùn)算效率。

目前來看,機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘重疊越來越多,通常難以分開。

2, Machine Learning vs. Artificial Intelligence(AI)

人工智能是解決(運(yùn)算)一些展現(xiàn)人的智能行為的任務(wù)。

2.1 機(jī)器學(xué)習(xí)通常能幫助實(shí)現(xiàn)AI。

2.2 AI 不一定通過ML 實(shí)現(xiàn)。

例如電腦下棋,可以通過傳統(tǒng)的game tree 實(shí)現(xiàn)AI 程序;也可以通過機(jī)器學(xué)習(xí)方法(從大量歷史下棋數(shù)據(jù)中學(xué)習(xí))來實(shí)現(xiàn)。

3,Machine Learning vs. Statistics

統(tǒng)計(jì)學(xué):利用數(shù)據(jù)來做一些位置過程的推斷(推理)。

3.1 統(tǒng)計(jì)學(xué)可以幫助實(shí)現(xiàn)ML。

3.2 傳統(tǒng)統(tǒng)計(jì)學(xué)更多關(guān)注數(shù)學(xué)假設(shè)的證明,不那么關(guān)心運(yùn)算。

統(tǒng)計(jì)學(xué)為ML 提供很多方法/工具(tools)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容