Ch04

ZhuYuanxiang 2020-10-12 18:15:39
Categories: Tags:

C04. 决策树

基本流程

决策树是基于树结构来进行决策的。

决策树的生成是一个递归过程,导致递归的原因:

划分选择

信息熵 ( Information Entropy ) 是度量样本集合纯度 ( purity ) 的指标。

划分属性的准则:

剪枝处理

决策树剪枝 ( pruning ) 是处理「过拟合」问题的主要手段。

剪枝的基本策略:

处理连续值与缺失值

多变量决策树

多变量决策树 ( Multivariate Decision
Tree ) 能够实现「斜划分」甚至更复杂的划分的决策树。

多变量决策树的 OC1 算法: