试论贝叶斯分类、决策树分类分类挖掘算法的优势与劣势,以及解决维度效应的策略
0 引言数据分类 是指按照分析对象的属性、特征,建立不同的组类来描述事物。数据分类 是数据挖掘的主要内容之一,主要是通过分析训练数据样本,产生关于类别的精确描述。这种类别通常由分类 规则组成,可以用来对未来的数据进行分类 和预测。分类 技术解决问题的关键是构造分类 器 。 一.数据分类 数据分类 一般是两个步骤的过程: 第1步:建立一个模型,描述给定的数据类集或概念集(简称训练集)。通过分析由