概述
实际上,对正在开展的活动,很难对其成果展开讨论或者在讨论之后终止活动.有时开展活动这件事本身更容易被视为成果,无法客观证明"已经没效果",是很难决定终止活动的.
相关分析的两种:指出可能的原因 or 找出环节中的问题
有时使用数据的绝对值难以说明问题,所以需要使用相对值
比较快照与趋势
比较大小与波动
如果部分相对于整体是无足轻重的,那么改善就是无意义的
分析时需要考虑主成分,有些变动剧烈但是占比低的可以忽略不计
分析原因使用自己能影响的变量(特别是自己没发现的变量,例如营业面积等可变数据)如果不能控制则只是研究
表->数->图
相关性:
离群点的处理
非线性相关
what型分解需要将指标分为加法和乘法(都是二元运算)加法并不是汇总,而是为了分类.另外还可以等到一些比例信息
另一方面可以把数据分为两类:动态数据和静态数据.我们可以用动态数据除以静态数据从而求平均数,至于这两个数据的成分可以用这个标准,如果事先知道的,是静态的(如年初就知道店数量,开店就知道营业时间),如果事后知道的,是动态的(营业额,销量)
平均值是将向量转为标量(减少了信息量)
所以替代平均值的方式是中位数和直方图
书中举了两个例子:一个是成绩,一般来说成绩可以看作是数值,因为是通过数加法运算而来,但是另一个例子(赞同和不赞同)这样的打分也被当成数字来运算
为什么是算术平均数而不是几何平均数
平均值保留了一些原始数据
数据处理的目的是为了消减数据,保持信息,消除噪声
分析值可以是绝对值也可以是相对值(例如增长率),甚至是相对值的相对值(多阶导数),所以为了确认一个问题是真实的需要绝对值低并且单调减
最后
以上就是跳跃香水为你收集整理的<如何用数据解决实际问题>读书笔记&思考的全部内容,希望文章能够帮你解决<如何用数据解决实际问题>读书笔记&思考所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复