監(jiān)督學(xué)習(xí)算法
基本過(guò)程:樣本學(xué)習(xí)得到預(yù)測(cè)函數(shù)f(x),測(cè)試集評(píng)估效果
常用的決策樹(shù)算法:ID3,C4.5和CART
屬性劃分的方法:ID3使用信息增益,C4.5使用信息增益率,而CART使用Gini基尼指數(shù)(三種)
在數(shù)據(jù)挖掘中,決策樹(shù)主要有兩種類型:
分類樹(shù) 的輸出是樣本的類標(biāo)。
回歸樹(shù) 的輸出是一個(gè)實(shí)數(shù) (例如房子的價(jià)格,病人呆在醫(yī)院的時(shí)間等)。