分类树和回归树的区别

290 阅读 0 评论 192 点赞

我是靠谱客的博主沉默康乃馨，这篇文章主要介绍分类树和回归树的区别，现在分享给大家，希望可以做个参考。

分类树
以C4.5分类树为例，C4.5分类树在每次分枝时，是穷举每一个feature的每一个阈值，找到使得按照feature<=阈值，和feature>阈值分成的两个分枝的熵最大的阈值(熵最大的概念可理解成尽可能每个分枝的男女比例都远离1:1)，按照该标准分枝得到两个新节点，用同样方法继续分枝直到所有人都被分入性别唯一的叶子节点，或达到预设的终止条件，若最终叶子节点中的性别不唯一，则以多数人的性别作为该叶子节点的性别。

总结：分类树使用信息增益或增益比率来划分节点；每个节点样本的类别情况投票决定测试样本的类别。

回归树
回归树总体流程也是类似，区别在于，回归树的每个节点（不一定是叶子节点）都会得一个预测值，以年龄为例，该预测值等于属于这个节点的所有人年龄的平均值。分枝时穷举每一个feature的每个阈值找最好的分割点，但衡量最好的标准不再是最大熵，而是最小化均方差即(每个人的年龄-预测年龄)^2 的总和 / N。也就是被预测出错的人数越多，错的越离谱，均方差就越大，通过最小化均方差能够找到最可靠的分枝依据。分枝直到每个叶子节点上人的年龄都唯一或者达到预设的终止条件(如叶子个数上限)，若最终叶子节点上人的年龄不唯一，则以该节点上所有人的平均年龄做为该叶子节点的预测年龄。

总结：回归树使用最大均方差划分节点；每个节点样本的均值作为测试样本的回归预测值。

最后

以上就是沉默康乃馨最近收集整理的关于分类树和回归树的区别的全部内容，更多相关分类树和回归树内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(192)

本文分类：Machine Learning&&Data Mining
浏览次数：290 次浏览
发布日期：2023-08-21 04:15:08

相关文章

Decision Trees

使用基尼指数划分属性的决策树（CART）

使用基尼指数划分属性的决策树（CART）

【模型检测学习笔记】9：Binary Decision Diagrams

【模型检测学习笔记】9：Binary Decision Diagrams

证明与计算(3): 二分决策图(Binary Decision Diagram, BDD)

证明与计算(3): 二分决策图(Binary Decision Diagram, BDD)

分类树和回归树的区别

决策树与回归树区别到底在哪

机器学习与R之回归树CART与模型树M5

机器学习与R之回归树CART与模型树M5

分类数和回归树的2个主要区别

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部