概述
决策树是基于树结构进行决策的,也称判定树。
关键是选择最优划分属性。
信息熵,是度量样本集合纯度最常用的一种指标。熵越小,则纯度越高。可以据此计算信息增益,信息增益越大,意味着纯度提升越大。
增益准则 对取值数目较多的属性有偏好,所以使用增益率。
剪枝,是决策树算法用来对付过拟合的主要手段。有时会造成分支过多,把样本学的太好了,导致过拟合。
最后
以上就是炙热热狗为你收集整理的机器学习第四章 决策树的全部内容,希望文章能够帮你解决机器学习第四章 决策树所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复