在機器學習算法中,決策樹(decision tree)是一種基本的分類與回歸方法。決策樹模型呈樹形結(jié)構,在分類問題中,表示基于特征對實例進行分類的過程。它可以認為是if-then規(guī)則的集合(互斥并且完備),也可以認為是定義在特征空間與類空間上的條件概率分布。其主要優(yōu)點是模型具有可讀性,分類速度快。
1. 概述
2. 特征選擇
2.1 信息增益
2.2 信息增益率
2.3 基尼指數(shù)
3. 決策樹生成
4. 決策樹剪枝
4.1 預剪枝
4.2 后剪枝
5. 連續(xù)與缺失值
5.1 連續(xù)值處理
5.2 缺失值處理
6. 多變量決策樹
7. sklearn中決策樹模型參數(shù)釋義
8. 實際使用技巧