纯真曲奇

文章
9
资源
0
加入时间
2年10月21天

数据挖掘1

数据质量分析的主要任务是检查原始数据中是否存在脏数据,脏数据一般是指不符合要求、以及不能直接进行相应分析的数据。在常见的数据挖掘工作中,脏数据包括如下内容:缺失值。异常值。不一致的值。重复数据及含有特殊符号(如#、*)的数据。缺失值的分析:使用简单的统计分析,可以得到含有缺失值的属性的个数,以及每个属性的未缺失数、缺失数与缺失率等。缺失值的处理:总体上来说,处理方式...