概述
#1.spss modeler 数据挖掘1
标签(空格分隔):3.1数据挖掘
线状型分析
- 原因性分析:对已出现问题查找原因
- 预测性分析:对未出现的情况预测走向
-依据:以往的数据
-市场推广费用/销售额的关系
数据科学–数据挖掘
#lesson1 数据挖掘概论
1.数据挖掘简介
围绕数据量发展
业务方面:
技术方面:
2.数据挖掘的一般步骤
数据准备:从相关数据源提取数据,整合成有用的数据集
规律寻找:用某种方法从大量数据中找出来规律
规律表示:表示出来
3.数据挖掘的相关发展阶段
阶段一:电子邮件阶段—数据量激剧增长
阶段二:信息发布阶段—web技术为代表信息发布式系统,爆炸式增长
阶段三:电子商务阶段—软件的推广和使用,服务商和用户之间的交互行为增加
阶段四:全程电子商务阶段
4.挖掘人员的技术要求
5.数据挖掘与传统技术的区别
先前未知:不能被直觉发现,甚至违背直觉
有效性:
实用性:
啤酒与尿布—关联销售
飓风天冰淇淋的销量增大
垃圾袋和咖啡的销量关联增长:公司后勤人员采购帮忙带买
6.数据挖掘的特点
7.常用的数据挖掘软件
#lesson2 数据挖掘的生命周期
1.项目的生命周期
2.DM系统体系结构
3.模型介绍
1)FAYYAD模型
弊端----忽略技术问题(需要和高要求的技术人员使用)
----适用于分析型环境(封闭型分析环境)
2)CRISP-DM模型
解决了fayyad模型的两个弊端
4.生命周期:
(1)业务理解
(2)数据理解
(3)数据准备
(4)建立模型
(5)评价
(6)实施
5.数据团队素养和能力组成
小公司:接触的技能比较广
大公司:某项技能研究而特别深
#lesson3 数据挖掘的相关技术介绍
1.统计基础知识
**总体:**观察单位的全体
**样本:**无法/不能对总体进行研究,随机抽取部分观察变量.此部分即称为样本时总体的子集
**集中趋势:**一组数据向某一中心值拢的程度.即寻找数据水平的代表值
**中位数:**处于中间位置的数.受极值的影响
**众数:**出现次数最多的数值,代表数据的一般水平.
**极差:**全距,极大值和极小值的差
**方差:**一组数据的平均离散水平方差的正平方跟
概率:随机事件出现可能性的大小的量度
2.数据挖掘技术简介
1.分析种类
1).分类预测
有目标,有目的—分类—条件细化
2).聚类(无导师)
无目的—基于事务的属性进行自动归类
多用于前期数据清洗与转换
3.关联
eg:零售的购物收银条,据此进行数据分析和挖掘,寻找关联性
4.序列相关分析(电商业分析常用)
5.异常分析
6).时间序列分析
预测未来发展情况—天气预报
2.数据挖掘的分析思路
#lesson4 业务理解基础
BA:业务着手,提出需要数据,进行分析,实施优化更改
DA:选用有效数据,清洗转换
后期发展
1.DA—2.DS(数据科学家,数学/统计学基础)
背景和基础是否符合你的发展方向,欠缺的技能提前习得
最后
以上就是内向大侠为你收集整理的1.spss modeler 数据挖掘1的全部内容,希望文章能够帮你解决1.spss modeler 数据挖掘1所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复