機(jī)器學(xué)習(xí)概論

[TOC]

## 開篇背景

目前,工作中的事情相對(duì)少一點(diǎn),富余時(shí)間比較足,因此,可以拿出一部分時(shí)間用來學(xué)習(xí)下機(jī)器學(xué)習(xí)方面的理論知識(shí)與實(shí)踐知識(shí)。這樣做主要出于兩個(gè)方面的目的,一方面是想通過本次整理的系列來增強(qiáng)與梳理自己在機(jī)器學(xué)習(xí)領(lǐng)域中的理解,梳理出自己在機(jī)器學(xué)習(xí)領(lǐng)域中的方法論,另一方面,提升自己的實(shí)際工作效率。

-------

好了,以上說明了本次系列的背景,接下來將主要闡述本系列的主要內(nèi)容:

* 希望能夠以自己的理解闡述什么是機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)的框架,機(jī)器學(xué)習(xí)可以用來解決什么樣的問題等等

* 闡述機(jī)器學(xué)習(xí)中常用的優(yōu)化方法

* 從模型的角度出發(fā),深入闡述不同模型,主要從以下幾個(gè)方面來闡述模型:a. 模型是什么(這種闡述是一種通用型的表述);b.模型產(chǎn)生的背景與原因(通常是為了解決另一個(gè)模型中的缺點(diǎn),而產(chǎn)生的一種新的模型);c.模型的應(yīng)用場(chǎng)景限制或者說是前提條件以及常見的應(yīng)用場(chǎng)景;d.模型涉及的梳理理論背景知識(shí);e.闡述模型的理論推導(dǎo)

* 最后,盡可能地能夠輸出一份相對(duì)完整的模型間的整合對(duì)比

以上就是本系列希望能夠?qū)崿F(xiàn)的一個(gè)目標(biāo),希望接下來會(huì)有系列2,系列3...,接下來將正式進(jìn)入本系列的內(nèi)容當(dāng)中。

## 什么是機(jī)器學(xué)習(xí)?

"機(jī)器學(xué)習(xí)"顧名思義,就是讓機(jī)器來學(xué)習(xí),如果將機(jī)器和人進(jìn)行類比的話,可以認(rèn)為機(jī)器的學(xué)習(xí)過程和人的學(xué)習(xí)過程在一定程度上是具有相似性的。通常,人在學(xué)習(xí)的過程中,都需要確定以下信息:1、學(xué)習(xí)什么領(lǐng)域的知識(shí)?2、學(xué)習(xí)的內(nèi)容或者目標(biāo)是什么?3、通過什么學(xué)習(xí)方法來進(jìn)行學(xué)習(xí),使得自己能夠快速掌握這些知識(shí)點(diǎn)?4、同時(shí),還有一個(gè)重要的點(diǎn),就是我們應(yīng)該將習(xí)得的知識(shí)應(yīng)用于我們的日常生活中,通過知識(shí)來豐富與提升個(gè)人的生活品質(zhì)嘛。

同理,機(jī)器學(xué)習(xí)也會(huì)遇到人在學(xué)習(xí)過程中所遇到的問題,比如:1、機(jī)器學(xué)習(xí)也是學(xué)習(xí)特定領(lǐng)域中的知識(shí)或者規(guī)律的,這里的特定領(lǐng)域通常就是指我們?cè)趯?shí)際的工作中所遇到的**業(yè)務(wù)問題**,而這個(gè)”業(yè)務(wù)問題“就是機(jī)器學(xué)習(xí)中所涉及到的知識(shí)背景;2、那么機(jī)器需要學(xué)習(xí)什么呢?這個(gè)學(xué)習(xí)的內(nèi)容通常需要我們?nèi)祟悈⑴c設(shè)計(jì),為什么呢,當(dāng)下機(jī)器學(xué)習(xí)終究還是為了我們?nèi)祟惗?wù)的,因此,為了讓機(jī)器能夠更好地服務(wù)于人類,那么我們自己就要扮演者"出題者"的決策,即你告訴機(jī)器學(xué)習(xí)什么內(nèi)容,這個(gè)過程實(shí)際上就是**建模**的過程,通常這也是在我們實(shí)際的工作生活中最重要的一部;3、當(dāng)人類給了機(jī)器設(shè)定了學(xué)習(xí)目標(biāo)(通常這個(gè)目標(biāo)是能夠用數(shù)學(xué)等相對(duì)抽象的方式進(jìn)行表達(dá))后,機(jī)器就需要能夠通過自己的方法論來學(xué)習(xí)以及人類所提供的材料(**數(shù)據(jù)**)來掌握目標(biāo)中的知識(shí)點(diǎn),通常機(jī)器用來進(jìn)行學(xué)習(xí)的方法論被稱為**優(yōu)化算法**,但是在這個(gè)學(xué)習(xí)過程中,我們?cè)趺磥砼袛嗨R(shí)點(diǎn)掌握得牢靠呢,同時(shí)我們還需要判斷它到底有沒有提升的空間呢,最可靠的方式就是制定標(biāo)準(zhǔn)化考試的評(píng)分機(jī)制(**損失函數(shù)**),來計(jì)算在該評(píng)分機(jī)制下的得分,從而判斷機(jī)器對(duì)知識(shí)點(diǎn)掌握的程度如何,如果達(dá)到令人滿意的程度,那么我們就可以給機(jī)器放假啦,但是,如果沒有達(dá)到令人滿意的程度,我們就需要想方設(shè)法地讓機(jī)器優(yōu)化其習(xí)得的結(jié)果(通常有以下做法:一、給機(jī)器提供更多的材料及數(shù)據(jù);二、讓機(jī)器不斷地投入精力(不斷迭代優(yōu)化);三、也許這個(gè)機(jī)器偏科,那么我們可以重新制定學(xué)習(xí)目標(biāo);四、既然一個(gè)人考試的結(jié)果不好,那么我們讓大家一起協(xié)同起來,各自發(fā)揮自己的長(zhǎng)處);4、最好,當(dāng)機(jī)器很好地掌握了知識(shí)點(diǎn)后,我們就可以放心地讓其來提升我們的業(yè)務(wù)啦。

以上通過相對(duì)形象的方式闡述了機(jī)器學(xué)習(xí)的過程到底是一個(gè)什么樣的情況,具體的如下圖:

![27f2aca802123ae25400b58246c496eb.png](evernotecid://E11A976C-FE50-42B3-8153-FCE0B3CB8878/appyinxiangcom/8981348/ENResource/p837)

## 機(jī)器學(xué)習(xí)可以解決什么問題?

機(jī)器學(xué)習(xí)的應(yīng)用面非常廣,但凡是所有能夠通過數(shù)學(xué)模型抽象出來的問題,理論上都是能夠應(yīng)用機(jī)器學(xué)習(xí)的,目前,主流的應(yīng)用有:推薦系統(tǒng),廣告TA,金融風(fēng)控等。在不同的應(yīng)用環(huán)境中,會(huì)有不同的業(yè)務(wù)問題,因此,通常會(huì)出現(xiàn)不同的模型,當(dāng)然有些模型也是能夠跨行業(yè),跨問題的,在實(shí)際過程中,還是需要具體問題具體分析,設(shè)計(jì)出最佳的業(yè)務(wù)數(shù)學(xué)模型。

## 機(jī)器學(xué)習(xí)有哪些常見的模型?

目前常見的模型有:線性回歸模型,logistics回歸模型,EM模型,樸素貝葉斯模型,決策樹,Boosting模型,Bagging模型,KNN模型,SVM模型,神經(jīng)網(wǎng)絡(luò)模型,HMM模型,時(shí)間序列模型、等等,每經(jīng)典的模型都值得我們花時(shí)間去深入分析與理解,本系列的后續(xù)文章中將逐一來闡述這些模型。

## 機(jī)器學(xué)習(xí)中有哪些常見的優(yōu)化算法?

在數(shù)學(xué)史上,數(shù)學(xué)大師們已經(jīng)提出很多的優(yōu)化算法來解決數(shù)學(xué)中的優(yōu)化問題,經(jīng)典有:最小二乘法、梯度下降法(隨機(jī)梯度下降法、Mini-batch隨機(jī)梯度下降法)、最大似然估計(jì)法、牛頓法、擬牛頓法等,除此之外,還有一些在計(jì)算機(jī)領(lǐng)域中常用的優(yōu)化算法,例如:SMO算法(后續(xù)補(bǔ)充...)等。在接下來的文章中,我們也將逐一來理解這些優(yōu)化算法

## 思考:如何建模

在上文也提到過,建模的過程通常是需要我們?nèi)藖韰⑴c設(shè)計(jì)的,那么在遇到一個(gè)實(shí)際的業(yè)務(wù)問題的時(shí)候,我們應(yīng)該如何建模呢?

(后續(xù)補(bǔ)充...)

好了,本文作為這個(gè)系列的第一篇,有點(diǎn)匆忙,后續(xù)將逐步來深入理解機(jī)器學(xué)習(xí)中的重要的知識(shí)點(diǎn)。

晚安,2018.3.15~

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容