平常芝麻

文章
7
资源
1
加入时间
2年10月17天

数据挖掘与机器学习——数据挖掘概述

挖掘是从大量的、不完全的、有噪声的、模糊的、随机的应用数据中,提取潜在且有用的信息的过程。分析分析处理(On-Line Analytical Processing ,OLAP)数据分析过程确定知识发现的目标:确定知识发现的目的。数据采集:数据采集可以是从网络爬取的数据,也可以是从数据库中直接导出的数据,还可以是常见的CSV文件等数据。数据质量决定挖掘的上限,而算法仅仅是逼近这个上限。数据探索:可视画(画各种散点图);相关性。数据预处理:数据处理主要包括数据清理、数据集成、数据规约、数据变换和离