Tree是一個(gè)比較簡單的算法,可以根據(jù)分類的純度將數(shù)據(jù)劃分為多個(gè)節(jié)點(diǎn);orange的樹可以處理離散數(shù)據(jù)集和連續(xù)數(shù)據(jù)集。
輸入是數(shù)據(jù)集和預(yù)處理方法,輸出是決策樹算法和訓(xùn)練的模型。

image.png
打開Tree的窗口,里面有幾個(gè)重要的指標(biāo):
Induce binary tree 創(chuàng)建一個(gè)二叉樹;
Min. number of instances in leaves 每個(gè)節(jié)點(diǎn)最小實(shí)例限制;
Do not split subsets smaller than 子集實(shí)例小于x的時(shí)候不再進(jìn)行拆分;
Limit the maximal tree depth to 樹的最大深度不深于x
對于分類:
Stop when majority reaches [%] 當(dāng)純度大于x時(shí)不再進(jìn)行拆分;
通過Tree模型插件后數(shù)據(jù)就分好類了,然后我們再使用Tree viewer可視化插件看下分類情況;
可以看到Tree viewer很形象的展示了決策樹,也表示出了每個(gè)特征分類值;
同樣也可以在后面增加一個(gè)Data Table看選中的數(shù)據(jù)。
對于模型如何使用,后面介紹。