概述
文章目录
- 场景
- 环境
- 正文
- 确定Hive版本
- 新建项目,并引入hive-jdbc依赖
- demo示例
- 结果
- 总结
- 随缘求赞
场景
在当前项目中,因为之前使用数据库查询,而随着数据的增多,查询速度会越来越慢,所以需要使用Java
来调用hive
进行数据统计。本篇博文主要是使用springboot
+hive
来查询hive
数据,并返回查询的数据结果。
环境
软件 | 版本 |
---|---|
springboot | 2.1.8.RELEASE |
CDH | 5.15.1 |
Hive | 1.1.0 |
正文
确定Hive版本
登录服务器控制台,我们可以使用命令:
hive --version
来查询hive
的具体版本,如下图:
新建项目,并引入hive-jdbc依赖
新建springboot
项目,并引入hive-jdbc
依赖。目前在maven hive-jdbc仓库中,最新的版本是3.1.2
。但是因为我们这里的环境版本是1.1.0
,所以要选择1.1.0
版本,不然就会代码运行的时候,就会报错。pom.xml
引入依赖如下:
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>2.6.5</version>
</dependency>
<dependency>
<groupId>org.apache.hive</groupId>
<artifactId>hive-jdbc</artifactId>
<version>1.1.0</version>
</dependency>
一般引入这个依赖就足够了,在本文的样例代码中,跑起来是没有问题的。
demo示例
因为是demo
示例,所以这里屏蔽了环境变量取参等可扩展部分,使用一个main
方法来调用我们的hive
查询相关的方法。demo
代码如下:
@SpringBootApplication
@Slf4j
public class AnalysisApp implements CommandLineRunner {
private static String driverName = "org.apache.hive.jdbc.HiveDriver";
public static void main(String[] args) {
SpringApplication.run(AnalysisApp.class, args);
}
@Override
public void run(String... args) throws Exception {
try {
Class.forName(driverName);
} catch (ClassNotFoundException e) {
e.printStackTrace();
System.exit(1);
}
Connection con = DriverManager.getConnection("jdbc:hive2://datanode02:10000/test", "hive", "");
Statement stmt = con.createStatement();
String tableName = "testHiveDriverTable";
log.info("删除表");
stmt.execute("drop table if exists " + tableName);
stmt.execute("create table " + tableName + " (key int, value string)");
// show tables
String sql = "show tables '" + tableName + "'";
log.info("Running: " + sql);
ResultSet res = stmt.executeQuery(sql);
if (res.next()) {
log.info(res.getString(1));
}
// describe table
sql = "describe " + tableName;
log.info("Running: " + sql);
res = stmt.executeQuery(sql);
while (res.next()) {
log.info(res.getString(1) + "t" + res.getString(2));
}
// select * query
sql = "select * from " + tableName;
log.info("Running: " + sql);
res = stmt.executeQuery(sql);
while (res.next()) {
log.info(String.valueOf(res.getInt(1)) + "t" + res.getString(2));
}
// regular hive query
sql = "select count(1) from " + tableName;
log.info("Running: " + sql);
res = stmt.executeQuery(sql);
while (res.next()) {
log.info(res.getString(1));
}
}
}
在官网Apache Hive HiveClient提供的demo
,里面引用的驱动类和我本文的驱动类是不同的,这个是因为引用的jar
包是不同的,所以才存在差异。所以,如果运行报错,提示驱动类不存在,则需要到自己引用的jar
包里面看看使用的驱动类具体路径是什么。
结果
把代码复制到自己的项目中,执行之后,控制台结果如下:
2020-06-08 13:45:01.457 INFO 4540 --- [ main] c.c.y.b.precision.analysis.AnalysisApp : Started AnalysisApp in 24.643 seconds (JVM running for 38.374)
2020-06-08 13:45:01.494 INFO 4540 --- [ main] org.apache.hive.jdbc.Utils : Supplied authorities: datanode02:10000
2020-06-08 13:45:01.495 INFO 4540 --- [ main] org.apache.hive.jdbc.Utils : Resolved authority: datanode02:10000
2020-06-08 13:45:01.620 INFO 4540 --- [ main] org.apache.hive.jdbc.HiveConnection : Will try to open client transport with JDBC Uri: jdbc:hive2://datanode02:10000/test
2020-06-08 13:45:01.966 INFO 4540 --- [ main] c.c.y.b.precision.analysis.AnalysisApp : 删除表
2020-06-08 13:45:02.764 INFO 4540 --- [ main] c.c.y.b.precision.analysis.AnalysisApp : Running: show tables 'testHiveDriverTable'
2020-06-08 13:45:03.153 INFO 4540 --- [ main] c.c.y.b.precision.analysis.AnalysisApp : testhivedrivertable
2020-06-08 13:45:03.153 INFO 4540 --- [ main] c.c.y.b.precision.analysis.AnalysisApp : Running: describe testHiveDriverTable
2020-06-08 13:45:03.418 INFO 4540 --- [ main] c.c.y.b.precision.analysis.AnalysisApp : key int
2020-06-08 13:45:03.418 INFO 4540 --- [ main] c.c.y.b.precision.analysis.AnalysisApp : value string
2020-06-08 13:45:03.419 INFO 4540 --- [ main] c.c.y.b.precision.analysis.AnalysisApp : Running: select * from testHiveDriverTable
2020-06-08 13:45:03.723 INFO 4540 --- [ main] c.c.y.b.precision.analysis.AnalysisApp : Running: select count(1) from testHiveDriverTable
2020-06-08 13:45:26.323 INFO 4540 --- [ main] c.c.y.b.precision.analysis.AnalysisApp : 0
总结
遇到一个新的需求,最好到官网去看看示例。如果不够详细,也可以搜索一下对应的博客。两者结合,一般可以解决很多问题了。
随缘求赞
如果我的文章对大家产生了帮忙,可以在文章底部点个赞或者收藏;
如果有好的讨论,可以留言;
如果想继续查看我以后的文章,可以点击关注
可以扫描以下二维码,关注我的公众号:枫夜之求索阁,查看我最新的分享!
最后
以上就是想人陪白昼为你收集整理的Hive学习系列:maven+springboot+CDH环境下,连接Hive进行操作场景环境正文总结随缘求赞的全部内容,希望文章能够帮你解决Hive学习系列:maven+springboot+CDH环境下,连接Hive进行操作场景环境正文总结随缘求赞所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复