【Python】决策树代码实践前言参考链接上代码!总结
本文所用代码为基于过程编程,通过不断修剪数据集并传递给下一级递归函数,并不断给决策树字典添加内容,从而完成决策树的构建。这样的好处在于逻辑清晰明了,但不如类的方式紧凑。用类的形式来完成最主要的难点在于节点数据结构的创建将节点定义为一个子类,其包含了①符合该特征的当前数据集,②剩余属性列表,③标签取值,④下一级节点(类似于一个指针)。此外,这里对连续数据的处理采用的是二分类,但本文代码完全可以实现多分类来离散特征,只需要修改离散函数即可。这里采用的是排列组合的方式生成分界点,然后遍历所有情况。