决策树是基于树结构进行决策的,也称判定树。
关键是选择最优划分属性。
信息熵,是度量样本集合纯度最常用的一种指标。熵越小,则纯度越高。可以据此计算信息增益,信息增益越大,意味着纯度提升越大。
增益准则 对取值数目较多的属性有偏好,所以使用增益率。
剪枝,是决策树算法用来对付过拟合的主要手段。有时会造成分支过多,把样本学的太好了,导致过拟合。
最后
以上就是炙热热狗最近收集整理的关于机器学习第四章 决策树的全部内容,更多相关机器学习第四章内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复