我是靠谱客的博主 跳跃香水,最近开发中收集的这篇文章主要介绍<如何用数据解决实际问题>读书笔记&思考,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

实际上,对正在开展的活动,很难对其成果展开讨论或者在讨论之后终止活动.有时开展活动这件事本身更容易被视为成果,无法客观证明"已经没效果",是很难决定终止活动的.

相关分析的两种:指出可能的原因 or 找出环节中的问题

有时使用数据的绝对值难以说明问题,所以需要使用相对值

比较快照与趋势

比较大小与波动

如果部分相对于整体是无足轻重的,那么改善就是无意义的

分析时需要考虑主成分,有些变动剧烈但是占比低的可以忽略不计

分析原因使用自己能影响的变量(特别是自己没发现的变量,例如营业面积等可变数据)如果不能控制则只是研究

表->数->图

相关性:

离群点的处理

非线性相关

what型分解需要将指标分为加法和乘法(都是二元运算)加法并不是汇总,而是为了分类.另外还可以等到一些比例信息

另一方面可以把数据分为两类:动态数据和静态数据.我们可以用动态数据除以静态数据从而求平均数,至于这两个数据的成分可以用这个标准,如果事先知道的,是静态的(如年初就知道店数量,开店就知道营业时间),如果事后知道的,是动态的(营业额,销量)

平均值是将向量转为标量(减少了信息量)

所以替代平均值的方式是中位数和直方图

书中举了两个例子:一个是成绩,一般来说成绩可以看作是数值,因为是通过数加法运算而来,但是另一个例子(赞同和不赞同)这样的打分也被当成数字来运算

为什么是算术平均数而不是几何平均数

平均值保留了一些原始数据

数据处理的目的是为了消减数据,保持信息,消除噪声

分析值可以是绝对值也可以是相对值(例如增长率),甚至是相对值的相对值(多阶导数),所以为了确认一个问题是真实的需要绝对值低并且单调减

最后

以上就是跳跃香水为你收集整理的<如何用数据解决实际问题>读书笔记&思考的全部内容,希望文章能够帮你解决<如何用数据解决实际问题>读书笔记&思考所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(47)

评论列表共有 0 条评论

立即
投稿
返回
顶部