我是靠谱客的博主 内向大侠,最近开发中收集的这篇文章主要介绍1.spss modeler 数据挖掘1,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

#1.spss modeler 数据挖掘1

标签(空格分隔):3.1数据挖掘


线状型分析

  • 原因性分析:对已出现问题查找原因
  • 预测性分析:对未出现的情况预测走向
    -依据:以往的数据
    -市场推广费用/销售额的关系

数据科学–数据挖掘

#lesson1 数据挖掘概论
1.数据挖掘简介
围绕数据量发展

业务方面:
image_1crofre17dsv14af69veoc1bgqi.png-49kb

技术方面:
image_1crpb4eubeqgq921jqq606bt09.png-51.5kb

2.数据挖掘的一般步骤
数据准备:从相关数据源提取数据,整合成有用的数据集

规律寻找:用某种方法从大量数据中找出来规律

规律表示:表示出来

3.数据挖掘的相关发展阶段
阶段一:电子邮件阶段—数据量激剧增长

阶段二:信息发布阶段—web技术为代表信息发布式系统,爆炸式增长

阶段三:电子商务阶段—软件的推广和使用,服务商和用户之间的交互行为增加

阶段四:全程电子商务阶段

4.挖掘人员的技术要求
image_1croha5sf1kks19lb16bamuk15qd1v.png-57.5kb

5.数据挖掘与传统技术的区别
先前未知:不能被直觉发现,甚至违背直觉

有效性:

实用性:

啤酒与尿布—关联销售
飓风天冰淇淋的销量增大
垃圾袋和咖啡的销量关联增长:公司后勤人员采购帮忙带买

6.数据挖掘的特点
image_1crohkvtseqo1kh5uhpl2e1bp32c.png-78.1kb

7.常用的数据挖掘软件
image_1crpbjq9p1nsr1j3i127e8k31ivlm.png-124.6kb

#lesson2 数据挖掘的生命周期

1.项目的生命周期
image_1crpbn7bimkilupt4nuoc13d81m.png-93.9kb

2.DM系统体系结构
image_1croila67ece1jhj1ohc1dgf1m8o9.png-73.6kb

3.模型介绍
1)FAYYAD模型
image_1croiuq2s3g817a4bok1ner12bq16.png-100.3kb

弊端----忽略技术问题(需要和高要求的技术人员使用)
----适用于分析型环境(封闭型分析环境)

2)CRISP-DM模型
解决了fayyad模型的两个弊端

image_1crpct3m610njcobmt1r5st0p3g.png-67kb

4.生命周期:
image_1crphu2q58141e2q1ms2lo01p6h13.png-348.2kb
(1)业务理解
image_1crpc655a1ejc4lrod41kcu19pd23.png-234.8kb

(2)数据理解
image_1crojnrti174u1sld1eqojf1rdr3m.png-132.3kb

(3)数据准备
image_1crojss631ac7iv91i9f19s21f9k43.png-174.1kb

(4)建立模型
image_1crok4pn7ijiplut4d1fmp1fdr4g.png-188.7kb

(5)评价
image_1crphjt61o0qu3k1528120i1knkm.png-171.7kb

(6)实施
image_1crok9vnq1jgk7s01gdi1rp5mst5t.png-200.3kb

5.数据团队素养和能力组成

小公司:接触的技能比较广
大公司:某项技能研究而特别深
image_1crphigaj1imgvhl1s4hrbkg79.png-142.7kb

#lesson3 数据挖掘的相关技术介绍

1.统计基础知识
**总体:**观察单位的全体
**样本:**无法/不能对总体进行研究,随机抽取部分观察变量.此部分即称为样本时总体的子集

**集中趋势:**一组数据向某一中心值拢的程度.即寻找数据水平的代表值

**中位数:**处于中间位置的数.受极值的影响
**众数:**出现次数最多的数值,代表数据的一般水平.
**极差:**全距,极大值和极小值的差
**方差:**一组数据的平均离散水平方差的正平方跟

概率:随机事件出现可能性的大小的量度
image_1crpj2pea1f3amle1fkq6ou3qk9.png-128.4kb

2.数据挖掘技术简介
image_1cromk93hlltbui40p1jf5oa16d.png-58.3kb

1.分析种类

1).分类预测
有目标,有目的—分类—条件细化

2).聚类(无导师)
无目的—基于事务的属性进行自动归类
多用于前期数据清洗与转换

3.关联
eg:零售的购物收银条,据此进行数据分析和挖掘,寻找关联性
image_1crorlkkb17b91m2nc8u12j8f507t.png-208.4kb

4.序列相关分析(电商业分析常用)

image_1crorp49i17ut17he1dtvmcm1d808a.png-248.8kb

5.异常分析
image_1crorsheb4a9161h1jue3mgtkb8n.png-184.3kb

6).时间序列分析
预测未来发展情况—天气预报
image_1cros0cb1fh3rfg1rhn1iid10oda4.png-233kb

2.数据挖掘的分析思路
image_1crpi601g1b3a16ocn84106e1hgr3t.png-85.8kb

#lesson4 业务理解基础
image_1crpi3u796pb10c2vu2mrb1b8v3g.png-90.5kb
BA:业务着手,提出需要数据,进行分析,实施优化更改

DA:选用有效数据,清洗转换
后期发展
1.DA—2.DS(数据科学家,数学/统计学基础)

背景和基础是否符合你的发展方向,欠缺的技能提前习得

image_1crossa2e15lm163h1ljhunb1537bu.png-297kb

最后

以上就是内向大侠为你收集整理的1.spss modeler 数据挖掘1的全部内容,希望文章能够帮你解决1.spss modeler 数据挖掘1所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(40)

评论列表共有 0 条评论

立即
投稿
返回
顶部