概述
整体流程:
1. 明确问题
2. 搭建框架(找到主线)
3. 数据提取:mysql, hive为主
4. 数据处理:Excel, R, Python
5. 数据分析
6. 数据展现(Tableau, Excel, R, Python)
7. 撰写报告(逻辑)---撰写完和业务沟通,才好接受挑战
8. 报告演讲(表达,应对)
9. 报告闭环
软技能掌握程度:
1. Mysql, hive→Linux(学有余力)--提数不能出错(超级熟练---跑数是高兴且自信的)
常见问题:把字符串类型当成数值型,采用max函数发现结果一直有错
Solution: select max(a+0)
先聚合再计数(可以提高效率)
一列变多行:Lateral view explode
避免数据倾斜:小表在左大表在右,map join, 同时对空值进行过滤
2. EXCEL---最高频有机会展示的工具(现场让你画个图)
数据透视表,相关性分析,临界点分析(下单超过3次,留存就会大幅提升)
3. R---统计语言,计算能力有限,导入过大数据可能死机
4. Python---脚本工具,Pandas,爬虫,文本挖掘
最后
以上就是纯情樱桃为你收集整理的【学习笔记】数据分析思维的全部内容,希望文章能够帮你解决【学习笔记】数据分析思维所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复