(三)分析大数据相关岗位1-3年工作经验的薪资水平(平均工资、最高工资、最低工资),并做出条形图展示出来;
3.1首先创建一个表data,把总表中大数据相关岗位的薪资字段和工作经验字段提取出来。
create table data as select salary,experience from job;
3.2再创建一个表data1用来存放从data表里面获取的1—3年工作经验的薪资。
create table data1 as select salary,experience from data where experience like '%1年经验%' or experience like '%2年经验%' or experience like '%3年经验%' or experience like '%1-2年经验%' or experience like '%1-3年经验%';
结果如下图:

3.3创建表data2用于提取表data1中的1—3年工作经验的薪资字段。
create table data2 as select salary from data1;
结果如下图:

3.4创建表data3用于去除data2薪资后面的引号。
create table data3 as select regexp_replace(salary,'"salary"','')as salary from data2;
结果如下图:

insert overwrite table data2 select * from data3 where salary is not null;

大数据相关岗位1-3年工作经验的薪资水平(平均工资、最高工资、最低工资),条形图结果展示:

(4)分析大数据相关岗位几年需求的走向趋势,并做出折线图展示出来;
create table xq as select * from job1 where position_name like '%大数据%';
create table xq1 as select release_date from xq;
create table xq2 as select regexp_replace(release_date,'"release_date"','')as release_date from xq1;
select count(*) from xq2 where release_date like '%05%';

select count(*) from xq2 where release_date like '%06%';

select count(*) from xq2 where release_date like '%07%';

大数据相关岗位几年需求的走向趋势,折线图展示:

最后
以上就是顺心荔枝最近收集整理的关于HIve+Sqoop实训报告(下)下的全部内容,更多相关HIve+Sqoop实训报告(下)下内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复