在數(shù)據(jù)分析中,機(jī)器學(xué)習(xí)是必不可少的工具。本系列將從以下幾個(gè)問(wèn)題出發(fā),探討機(jī)器學(xué)習(xí)中模型的運(yùn)作原理:
- 理解機(jī)器學(xué)習(xí)模型的到底是什么?
- 建立一個(gè)機(jī)器學(xué)習(xí)的模型并預(yù)測(cè)房?jī)r(jià)
- 學(xué)習(xí)如何評(píng)價(jià)和改進(jìn)模型
基本的機(jī)器學(xué)習(xí)模型
做預(yù)測(cè)是日常生活中必不可少的一部分。例如,如果我們?cè)谇耙惶焱砩喜怀潆?,那么我們就?huì)預(yù)測(cè)手機(jī)將會(huì)在今天耗盡電量。如果我們觀察到大風(fēng)和閃電,我們就會(huì)預(yù)測(cè)將會(huì)下雨。以前的生活經(jīng)驗(yàn)是我們做這些預(yù)測(cè)的依據(jù)。同樣的,機(jī)器學(xué)習(xí)模型也是如此:它基于已經(jīng)給出的例子來(lái)預(yù)測(cè)特定條件下的結(jié)果。本篇就將以預(yù)測(cè)房?jī)r(jià)為例子來(lái)解析機(jī)器學(xué)習(xí)的運(yùn)作原理。
在此,我們基于一個(gè)特定的機(jī)器學(xué)習(xí)模型——決策樹(shù)來(lái)分析。事實(shí)上有很多不同種類(lèi)的機(jī)器學(xué)習(xí)模型,每一個(gè)尤其優(yōu)缺點(diǎn),但是決策樹(shù)模型是一個(gè)較好的用來(lái)入門(mén)的模型。
下圖便是一個(gè)簡(jiǎn)單的決策樹(shù):

對(duì)于所有房子均可以采用上述的決策樹(shù)的邏輯。估價(jià)中根據(jù)房子的特性進(jìn)行判斷,決策樹(shù)的最下方便是對(duì)房?jī)r(jià)的預(yù)測(cè)。對(duì)其,稱之為為決策樹(shù)的葉子節(jié)點(diǎn)。這些節(jié)點(diǎn)實(shí)際上由數(shù)據(jù)決定。