顺心硬币

文章
2
资源
0
加入时间
3年0月28天

大厂常考决策树模型面试题总结问题1:ID3、C4.5、CART树的算法思想问题2:ID3、C4.5、CART树分裂依据的公式问题3:为什么信息增益比比信息增益好?问题4:ID3、C4.5、CART树的区别问题5:随机森林的大致过程和优缺点问题6:随机森林和GBDT区别

问题1:ID3、C4.5、CART树的算法思想ID3算法的核心是在决策树的每个节点上应用信息增益准则选择特征,递归地构架决策树。C4.5算法的核心是在生成过程中用信息增益比来选择特征。(1)经验熵 刻画了对数据集进行分类的不确定性。(2)经验条件熵 刻画了在特征 A 给定条件下,对数据集分类的不确定性。(3)信息增益 刻画了由于特征 A 的确定,从而使得对数据集的分类的不确定性减少的程度。信息增益:数据集 D 的经验熵与关于特征 A 的经验条件熵的差值。问题2:ID3、C4.