概述
(三)分析大数据相关岗位1-3年工作经验的薪资水平(平均工资、最高工资、最低工资),并做出条形图展示出来;
3.1首先创建一个表data,把总表中大数据相关岗位的薪资字段和工作经验字段提取出来。
create table data as select salary,experience from job;
3.2再创建一个表data1用来存放从data表里面获取的1—3年工作经验的薪资。
create table data1 as select salary,experience from data where experience like '%1年经验%' or experience like '%2年经验%' or experience like '%3年经验%' or experience like '%1-2年经验%' or experience like '%1-3年经验%';
结果如下图:
3.3创建表data2用于提取表data1中的1—3年工作经验的薪资字段。
create table data2 as select salary from data1;
结果如下图:
3.4创建表data3用于去除data2薪资后面的引号。
create table data3 as select regexp_replace(salary,'"salary"','')as salary from data2;
结果如下图:
insert overwrite table data2 select * from data3 where salary is not null;
大数据相关岗位1-3年工作经验的薪资水平(平均工资、最高工资、最低工资),条形图结果展示:
(4)分析大数据相关岗位几年需求的走向趋势,并做出折线图展示出来;
create table xq as select * from job1 where position_name like '%大数据%';
create table xq1 as select release_date from xq;
create table xq2 as select regexp_replace(release_date,'"release_date"','')as release_date from xq1;
select count(*) from xq2 where release_date like '%05%';
select count(*) from xq2 where release_date like '%06%';
select count(*) from xq2 where release_date like '%07%';
大数据相关岗位几年需求的走向趋势,折线图展示:
最后
以上就是顺心荔枝为你收集整理的HIve+Sqoop实训报告(下)下的全部内容,希望文章能够帮你解决HIve+Sqoop实训报告(下)下所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复