決策樹是機器學習中用于預測建模的一種重要的算法類型。
決策樹模型的表現(xiàn)形式是二叉樹。實際上,它就是算法和數(shù)據(jù)結(jié)構(gòu)中的二叉樹,沒什么太花哨的。 每個節(jié)點代表一個輸入變量(x)和該變量上的分支(這里假設(shè)是數(shù)字類型的變量)。

樹的葉節(jié)點包含用于進行預測的輸出變量(y)。 通過不斷遍歷樹的各個分支,最終到達某個葉節(jié)點,并在該葉節(jié)點處輸出你要預測的類別值。
決策樹的學習過程很短,預測速度非??臁?對于一般類型的問題,他們的準確性不錯。你也不需要對數(shù)據(jù)作特別的準備。
決策樹具有高方差,但如果與集成學習搭配使用,可以提高預測的準確度。我們將在第13課和第14課中討論這個主題。