概述
文章目录
- 1. 技术能力
- 1.1 数理统计基础
- 1.1.1 统计学
- 1.1.2 机器学习(算法)
- 1.2 分析工具
- 1.2.1 SQL
- 1.2.2 Python
- 1.2.3 可视化
- 2. 业务能力
- 2.1 逻辑思维类
- 2.1.1 行测题
- 2.1.2 费米问题
- 2.2 业务场景类
- 2.2.1 数据异动类
- 2.2.2 指标体系搭建
- 2.2.3 场景探索类
- 2.2.4 其他
1. 技术能力
主要指对常用技术和工具的熟练掌握程度,在数据分析领域广为流传一句名言:技术决定下限,思维决定上限(数据分析思维)。所以说,对于一名合格的数据分析师而言,技术是必须要掌握的。这里所说的技术主要指数理统计基础(统计学、机器学习)和分析工具(SQL、Python、可视化等)。
1.1 数理统计基础
1.1.1 统计学
统计学常考知识点
常见问题:
- 随机变量
1.1 简述随机试验 & 随机变量 & 样本
1.2 简述离散型随机变量 & 连续型随机变量 - 常用特征
2.1 简述期望 & 方差及标准差 & 分位数 & 协方差及相关系数
2.2 随机变量X+Y、XY的期望与X、YX、Y期望的关系
2.3 分布的期望和中位数的关系
2.4 变量独立和不相关的关系 - 中心极限定理
3.1 正态分布特性及 3 σ 3sigma 3σ法则
3.2 简述常见的大数定律(辛钦、伯努利、切比雪夫)及异同点
3.3 简述中心极限定理 - 假设检验
4.1 原假设与备择假设
4.2 假设检验的基本思想
4.3 两类错误及该如何平衡
4.4 详述假设检验中的p-value、显著性水平、置信度和检验效能
4.5 z 检验和 t 检验的区别 - 贝叶斯统计概论
5.1 频率派与贝叶斯派的统计思想的区别
5.2 简述条件概率
5.3 简述贝叶斯公式和全概率公式
5.4 什么是三门问题?用贝叶斯公式进行解释
1.1.2 机器学习(算法)
数据分析对技术要求不高,算法考察不会很深入,一般也是被列为加分项。只要你能了解各类算法的优缺点、使用场景以及对常见算法的基本原理熟悉就行了。
机器学习常考知识点
常见问题:
- 常用概念
1.1 数据集划分
1.2 参数与超参数
1.3 过拟合与欠拟合—偏差、方差和误差 - 常见模型及分类
2.1 模型分类
2.1.1 监督学习与非监督学习模型
2.1.2 参数与非参数模型
2.1.1 生成与判别模型
2.2 常见模型
2.2.1 线性回归模型
2.2.2 逻辑回归模型
2.2.3 决策树模型模型
2.2.4 随机森林及Boosting模型
2.2.5 XGBoost模型 - 效果评估
3.1 预测问题常用的评估方法
3.2 分类问题常用的评估方法
1.2 分析工具
1.2.1 SQL
SQL是数据分析工作中的敲门砖,排版和字体稍微工整一点,如果能注释自己为什么要这么写是最好的,方便复盘及他人查阅。
SQL杂记
1.2.2 Python
1.2.3 可视化
Excel
Tableau
推荐资料:
- Tableau零基础教程
2. 业务能力
主要指对业务的理解程度以及解决业务问题的能力,能体现出结构化思维以及思维的广度和深度。这也是作为一个数据分析师的核心竞争力。业务面最常考察的是两大类问题,一类是逻辑思维类问题,另一类是业务场景类问题。
数据分析师的种类:
- 负责支持产品、运营团队的分析师,大部分数据分析师都可以归为这类。主要的工作内容是产品迭代的效果分析、ABtest的实验设计与效果评估、产品改版方案的策略输出、活动运营的效果分析、用户运营的目标用户筛选、拉新、复购的策略输出;
- 负责支持集团管理层的分析师。这类数据分析师普遍归属于战略部门,要求有极强的业务能力和前瞻性,而且对学历背景要求极高。工作内容是对公司整体的宏观情况分析、不同业务的横纵向对比分析、战略方向的策略输出;
- 负责行业研究的分析师。这类数据分析师普遍集中在咨询行业,基本是以项目进行结算,他们能够在很短的时间对一个领域了解的透彻,重在分析。这类数据分析师的出路挺广的,但咨询行业一般对背景要求也高。主要侧重于某个行业的大盘情况、竞争对手的供给、策略、产品等分析、是否有新的机会和增长点分析。
2.1 逻辑思维类
逻辑思维类题主要考两类,一类是行测题,与公务员行测题基本类似;另一类是费米问题,主要考察结构化思维能力。
2.1.1 行测题
行测题即Administrative Aptitude Test(简称AAT),数据分析岗的行测题主要考察数分相关的知识、技能和能力,主要从言语文字、图表分析、逻辑推理这三类题型进行考察。
经典例题:
- 【言语文字类】
- 【图标分析类】
- 【逻辑推理类】
2.1.2 费米问题
是在科学研究中用来做量纲分析、估算和清晰地验证一个假设的估算问题,这类问题通常包括关于给定限定信息的有可能计算的数量的猜想的验证。
费米问题能将理科思维和文科思维的人很好地区分开来,目的在于考察候选人的量化技能、逻辑推演和商业意识,考察的重点不在于答案本身,而是分析和解决问题的能力,具体可采用逻辑树法展开分析
逻辑树法:把一个庞大的、抽象的、复杂的问题,逐级拆解为微小的、具体的、简单的问题,然后再将这些小问题进一步拆解,只要保证了逻辑关系,那么将这些可以回答的小问题答案,逐步反推到费米问题上,就可以得到最终的准确答案。其核心就是逻辑拆解
原理:平均律,在任何一组计算中,估算带来的错误都可以相互抵消,所拆解的小问题越多,被抵消的概率越大。而对于小问题的估算,不要估算其本身,而是先估算其上下界,然后在十倍的范围内估算出数值,再综合其他拆解出的小问题,能保证极高的准确率
经典例题:
- 全国多少个加油站;
- 胡同口的煎饼摊子一年能卖多少个煎饼?;
2.2 业务场景类
业务场景题主要考察对业务的理解以及解决某些业务问题的底层方法论,常考的业务场景题有数据异动类、指标体系搭建、场景探索类和其他。
2.2.1 数据异动类
数据分析之异动分析
常见问题:
- 你负责一款APP的日常数据监控,发现某天该产品的DAU突然下降了10%,接下来你该如何分析?
2.2.2 指标体系搭建
数据分析之指标体系搭建
常见问题:
- 你要去面试抖音的数据分析师,请你说一下短视频类指标体系该如何搭建?
2.2.3 场景探索类
- 你要去面试某家电商公司,某条线业务部门在上周结束了为期一周的大促,需要你对活动进行整体评估,你会如何分析?
2.2.4 其他
最后
以上就是狂野火车为你收集整理的【数分】0. 总述1. 技术能力2. 业务能力的全部内容,希望文章能够帮你解决【数分】0. 总述1. 技术能力2. 业务能力所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复