概述
1、数据准备:
一维表的列标签是字段,二维表的列标签是数据
|
2、数据处理:根据数据分析的目的,将收集到的数据,用适当的处理方法进行整理加工,形成适合数据分析的要求样式。
|
(1)删除重复值:countif 条件格式 高级 数据删除重复项
(2)缺失数据:缺失值是指在数据集中某个或某些属性的值是不完全的。
- 机械原因:由于数据收集或保存失败造成的数据缺失,如数据存储的失败,存储器失败,机器故障导致某段时间数据未能收集等
- 人为原因:由于人的主观失误、历史局限或有意隐瞒造成的数据缺失,如在市场调查中被访人拒绝透露相关问题的答案,或者对问题的回答是无效的,抑或数据录入人员失误漏录了数据。
|
(3)数据加工
- 数据抽取:是指保留数据表中某些字段的部分信息,组合成一个新字段。截取某一字段的部分信息——字段分列;将某个字段合并为一个新字段——字段合并;将原数据表没有但其他数据表中有的字段,有效的匹配过来——字段匹配。
- 数据计算
- 数据转换
(4)数据抽样
|
最后
以上就是含糊日记本为你收集整理的谁说菜鸟不会数据分析(入门篇)----- 学习笔记3(数据准备、处理)的全部内容,希望文章能够帮你解决谁说菜鸟不会数据分析(入门篇)----- 学习笔记3(数据准备、处理)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复