概述
谷歌的首席经济学家哈尔范里安认为统计学家事世界上最棒的职业,“如果你想成功,你不应该称为一个普通的、可被随意替代的人,你应该称为稀缺的、不可替代的那类人。数据非常之多而且具有战略重要性,但是真正缺少的事从数据中提取价值的能力。这也就是为什么统计学家、数据库管理者和掌握机器理论的人是真正了不起的人”
业务分析,从数据中持续地探查、挖掘从而得到洞察以帮助人们进行决策的一系列技巧、技术、应用和实施等。业务分析着眼于挖掘数据中隐现的洞见、更深入的理解业务。商业智能大多利用查询、报告、olap和预警等工具,回答“过去发生了什么”、“发生的频率”、“问题在哪里”、“下一步要采取哪些措施”等。而业务分析则着重利用数据分析工具回答“为什么发生这样的问题“、”将来还可能发生什么“、”能够采取的最优措施是什么“等问题。
数据探查常用的统计量:
1)正态分布
对大量的独立随机变量,可用两个参数来考察其分布,现实世界中各种各样的测试或观察数据都是复合正态分布的。
2)5%trimmed mean截尾均值
去掉5%的最高值和去掉5%的最低值之后的平均值。
3)Median中间值
最大值和最小值的平均值。
4)Variance方差
反映各个观察量距平均值的离散程度。
5)Std.Deviation标准差
方差的二次开方。代表离散程度的统计
最后
以上就是孤独冬天为你收集整理的读《发现数据之美》一书的全部内容,希望文章能够帮你解决读《发现数据之美》一书所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复