概述
背景
随着人工智能及大数据的迅速发展,数据分析、数据挖掘、大数据等岗位开始火热起来,相比数据挖掘,数据分析岗位门槛更低一些,越来越多的小伙伴准备进入数据分析行业。目前互联网行业处于寒冬,某些大厂传出裁员,数据分析岗位需求到底如何?带着这个疑问,我们展开如下分析,旨在给自己和准备进入该行业的小伙伴提供一个参考。
一、明确分析目的
1.岗位数量不同城市数据分析岗位需求
不同细分行业数据分析岗位需求
不同工作年限数据分析岗位需求
2.薪资不同城市岗位薪资情况对比
不同工作年限与薪资关系
公司规模与薪资关系
3.技能要求技能要求有哪些
岗位技能要求占比
不同技能要求的薪资分布
学历要求占比
大公司技能及工作年限要求
二、数据收集与理解数据来源:某招聘网站2019年12月初招聘数据
数据导入与理解:理解数据集各字段含义
分析工具:Python
三、数据处理
1.字段选择
根据分析的目的选择数据集中部分字段,本次选用字段:city、companyFullName、companyShortName、companySize、education、industryField、jobNature、positionId、positionName、salary、workYear、job_detail。
2.重复值处理
字段中的positionId具有唯一识别性(类似SQL中主键),根据positionId删除重复行记录。方法:drop_duplicates()
3、缺失值处理
查看数据集缺失值情况,只有job_detail缺失,并且缺失情况比较严重,总共2946条数据,缺失率52.37%。由于最后需要分析岗位技能要求,因此不能删除缺失值。目前暂不做处理,后期可根据其他字段信息,将技能填充。
4、异常值处理positionName:①该字段存在与数据分析岗位无关的职位,例如python开发工程师、产品经理等职位,需要剔除。职位名称中包含“数据分析”“数据运营”“分析师”的保留。②剔除数据分析实习岗位。 方法:contains结合逻辑运算符(&、|、~)
jobNature:工作性质,选出全职,剔除兼职、实习。 方法:contains
workYear:工作年限,将“1年以下”,“应届毕业生”,“不限”替换成“0-1年”,便于统计。 方法:str.replace
5、字段拆分industryField:公司所属领域拆分,有的公司有多个领域,例如:‘移动互联网,金融’等,将该字段拆分,便于统计。若领域既包含移动互联网+其他行业,将公司领域归为其他行业;若领域包含(除互联网外)行业1+行业2,公司领域归为行业1、行业2;若领域只有互联网,将公司领域归为互联网。方法:split、join、map、reshape(pandas.dataframe没有内置reshape方法,但是可以.values用来访问基础的numpy数组对象并对其进行调用reshape)
salary:薪水是区间范围,例如‘15k-30k’,将该字段拆分出最低薪水、最高薪水,计算出平均薪水。方法:extract、map
job_detail:职位描述中拆分出技能要求,主要分为Python/R,SQL,Excel,SAS/SPSS、Tableau等几类。方法:one-hot编码,map、lambda函数
至此,数据处理工作完成。
四、数据分析及可视化
不同城市数据分析岗位需求量
从上图可以看出,数据分析岗位需求量最多五个城市为北京、上海、深圳、广州、杭州,其中北京、上海位居前两位,其他城市数据分析岗位需求较少,天津虽离北京较近,但与北京相比,数据分析岗位很少。因此,如果打算找数据分析相关工作,最好还是去一线城市。
不同细分行业数据分析岗位需求
数据分析不会脱离业务存在,每个行业领域的业务知识也不一样,想进入哪个行业的数据分析岗位就需要熟悉相应行业业务,最好有自己独到见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的使用价值。
从上图可以看出,电商、金融、数据服务行业数据分析岗位需求量位于前三位,若有金融教育背景或行业经验,金融行业的数据分析岗是不错的选择;若无金融行业经验,电商、数据服务行业是更好的选择。
不同工作年限数据分析岗位需求
从上图可以看出:① 具有0-1年工作经验数据分析岗位数量占有一定比例(约1/7),说明数据分析岗位的门槛不是很高,努力学习数据分析所需的相关知识,还是有很大可能进入该行业的。②具有3-5年工作经验需求量最多,其次是具有1-3年工作经验,根据招聘市场需求量,积累一定行业经验后,可选择的岗位更多一些。
不同城市岗位薪资情况对比
从图中可以看出,北京、上海、杭州、深圳月平均薪资位于第一梯队,均超过20k;苏州、广州、武汉、厦门月平均薪资位于第二梯队,在15k左右;图上其它城市月平均薪资位于第三梯队,除西安在10k以下,其余均在10-15k之间。
令人疑惑的是一线城市广州,与其他一线城市相比,月平均薪资相差一截。我们来看看北上广深杭薪资分布情况。
从上图可看出,广州数据分析岗位薪资分布集中在10k左右;杭州、深圳、上海分布相似,集中在20k左右;北京数据分析岗位薪资分布集中在20-25k。
不同工作年限与平均薪资关系
从图中可以看出,随着工作年限的增加,月平均薪资也在稳步上涨,0-1年与1-3年相比,薪资涨幅不大,3-5年、5-10年薪资上涨较快,约为0-1年、1-3年的1.5倍-2倍。
城市、工作年限与薪资交叉对比
从上图中横向对比,可以发现相同工作年限,北京、上海、杭州、深圳薪资位于第一梯队,广州薪资水平不如北上杭深;纵向对比,随工作年限增加,薪资也在上涨,北上杭深3-5年工作经验的数据分析师能拿到20k以上的薪资,5-10年工作经验薪资能达到30k以上。
公司规模与薪资关系
从图中可以看出,相比其他规模的公司,2000人以上、500-2000人的公司,平均薪资更高一些,因此在选择offer时候,无论是从薪资方面还是考虑职业长远发展,都应该选择大公司。
下图是不同规模的公司具体薪资分布情况
从图中可以看出,相同工作年限,50人以下的小公司薪资水平低于规模大一些公司的薪资水平;并且随着工作年限的增加,薪资中位数也在上涨。5-10年工作经验薪资中位数在30k左右。
招聘岗位技能要求
在数据分析行业中,工具的熟练使用是必不可少的,那数据分析岗位招聘都要求掌握哪些技能呢?我们先定性看下
从词云图上可以看出,数据分析岗位招聘技能要求主要有:SQL、Python/R、Excel、SAS/SPSS/Tableau、Hadoop/Hive/Spark
招聘岗位技能要求占比
从词云图中我们对数据分析岗位工具技能要求有了定性的认识,但是工具技能种类繁多,在有限时间里我们不可能熟练掌握所有的分析工具,并且在工作中并不是所有工具都会用到,根据“二八法则”我们只要熟练掌握工作中最常使用的分析工具,便可以胜任大部分的分析工作。那最常用的工具技能有哪些呢?招聘占比是怎样的呢?让我们一起来看看
从图中可以看出,在数据分析岗位描述中有59.5%的公司要求会Python/R,有58.0%的公司要求会SQL,有32.7%的公司要求会Excel,要求会SAS/SPSS/Tableau的占30.6%,要求会Hadoop/Hive/Spark的公司占22.6%。Python/R、SQL、Excel是数据分析的主要工具,应当熟练掌握。
不同技能要求的薪资分布情况
从图中可以看出,要求会Python/R、SQL岗位薪资中位数均达到20k,薪资上Python没有比SQL的更有优势,熟练掌握SQL依然能拿到不错的薪资;熟练掌握Hadoop/Hive/Spark能拿到更高的薪资(薪资中位数25k左右),但要求掌握Hadoop/Hive/Spark的公司占比不高;而要求会SAS/SPSS/Tableau岗位薪资整体上不如Python/R、SQL岗位薪资,只要求会Excel的岗位薪资远低于要求会Python/R、SQL的岗位薪资。
因此从事数据分析岗位,应当最起码熟练掌握SQL,才能拿到不错的薪水,其次熟练使用Python/R;若想拿更高薪水,可以学习Hadoop/Hive/Spark等方面知识。
学历要求占比
数据分析岗位相比于数据挖掘、算法来说,门槛较低,学历要求较低,那事实真是这样吗?让我们看看招聘岗位中对学历要求占比。
从图中可以看出,数据分析岗招聘中有83.4%要求是本科学历,只有3.9%要求硕士研究生,说明数据分析岗对学历要求不高。
大公司(2000人以上)招聘对技能&工作年限要求
比起小公司,大公司(2000人以上)岗位薪资更高,制度更加健全,很多人梦寐以求的想进入BAT这种级别的大公司,那大公司(2000人以上)对数据分析岗位技能有哪些要求,更倾向于招聘哪个工作经验段的数据分析师呢?让我们来一起看看
从左图可以看出,对于有招聘技能要求的大公司,要求掌握SQL技能的岗位占比59.7%,要求掌握Python/R技能的岗位占比约54.9%,要求掌握Excel技能的岗位占比34.0%,要求掌握Hadoop/Hive/Spark及SAS/SPSS/Tableau技能的岗位占比不到30%,因此如果想进入大公司,Python/R、SQL应当熟练掌握。
从右图可以看出,2000人以上的大公司数据分析岗招聘,主要集中在3-5年(44.8%)、1-3年(27.5%)工作经验段,0-1年工作经验的招聘仅占15.3%。
五、结论
1、需求量:①一线城市(北京、上海、深圳、广州、杭州)数据分析岗位需求量大;②主要集中在电商、金融、数据服务行业;③3-5年工作经验的需求量最大。
2、薪资:①北京、上海、杭州、深圳薪资位于第一梯队,广州位于第二梯队;②工作年限增加,薪资上涨,北上杭深3-5年工作经验薪资20k以上,5-10年工作经验薪资30k以上;③相同工作年限,小公司薪资水平低于大公司的薪资水平;④要求会Python/R、SQL数分岗位薪资中位数达到20k,熟练掌握Hadoop/Hive/Spark能拿到更高的薪资(薪资中位数25k左右)。
3、技能要求:要求熟练掌握Python/R的职位占比59.5%,要求熟练掌握SQL的职位占比58.0%;其中2000人以上的大公司,要求掌握SQL的职位占比约59.7%,要求熟练掌握Python/R的职位占比约54.9%,Python/R、SQL逐渐成为数据分析师的必备技能。
4、数据分析岗位对学历要求不高,其中要求学历为本科的岗位占比83.4%,要求硕士研究生学历的岗位仅占3.9%。
最后
以上就是有魅力白开水为你收集整理的python数据分析师工作_数据分析师岗位需求分析(Python)的全部内容,希望文章能够帮你解决python数据分析师工作_数据分析师岗位需求分析(Python)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复