懵懂饼干

文章
3
资源
0
加入时间
2年10月17天

数据挖掘之数据预处理小结

数据预处理的主要步骤:数据清理,数据集成、数据规约和数据变换。目的主要是将缺失的数据补充完整,消除噪声数据,识别和删除离群点并解决不一致性。做到将数据格式标准化、异常数据清除、错误纠正、重复数据清除。1)异常数据处理:异常数据分析:(1)使用统计值进行判断,最大值、最小值、平均值等判断是否超出范围。(2) 使用3原则,异常值和平均值比超出三倍标准差及小概率事件,可看做异常值.(3)箱线图...