我是靠谱客的博主 凶狠过客,最近开发中收集的这篇文章主要介绍hiveserver2 和beeline_Hive2.x、HiveServer、HiveServer2简述及Beeline使用,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

Hive2.x

hive2.x特性

LLAP(Live Long and Process)Hive2.1进行了极大的性能优化。在Hive2.x开启LLAP与Apache Hive1.x进行对比测试,其性能提升约25倍。

支持使用HPL/SQL的存储过程,Hive2.0.0推出的Hive Hybrid Procedural SQL On Hadoop (HPL/SQL) 是一个在Hive上执行过程SQL的工具,它可以表达复杂的业务规则。

更智能的成本优化器CBO,Hive2.0开始持续不断地优化成本优化器CBO,尤其是在BI业务关注的TPC-DS查询上。

提供全面详尽的监控和诊断工具,可以通过新的Hive Server2 Web UI,LLAP Web UI和Tez Web UI查看Hive相关的HQL查询以及关联的作业状态和日志。丰富了Hive用户的运维和排错的手段。

HiveServer

在hive的机器上启动一个server:客户端可以通过ip + port的方式对其进行访问之后,就可以有很多客户端连到这个server上面去干活可以采用jdbc、odbc、beeline的方式进行连接

HiveServer是一种可选服务,允许远程客户端可以使用各种编程语言向Hive提交请求并检索结果。HiveServer无法处理来自多个客户端的并发请求.从Hive 0.11.0版本开始。建议使用HiveServer2。

HiveServer2

HiveServer2(HS2)是一种能使客户端执行Hive查询的服务。 HiveServer2是HiveServer1的改进版,HiveServer1已经被废弃。HiveServer2可以支持多客户端并发和身份认证。旨在为开放API客户端(如JDBC和ODBC)提供更好的支持。

远程HiveServer2模式是Hive产品使用的推荐模式,它更加安全并且不需要直接为用户对HDFS/metastore进行赋权。

Beeline

是hive的新hiveCLI

CLI hive -vs- Beeline

# Beeline操作结果

0: jdbc:hive2://node225:10000/movie> select * from t_user limit 5;

OK

+----------------+----------------+-------------+--------------------+-----------------+--+

| t_user.userid | t_user.gender | t_user.age | t_user.occupation | t_user.zipcode |

+----------------+----------------+-------------+--------------------+-----------------+--+

| 1 | F | 1 | 10 | 48067 |

| 2 | M | 56 | 16 | 70072 |

| 3 | M | 25 | 15 | 55117 |

| 4 | M | 45 | 7 | 02460 |

| 5 | M | 25 | 20 | 55455 |

+----------------+----------------+-------------+--------------------+-----------------+--+

# hive 操作结果

hive> select * from t_user limit 5;

OK

1 F 1 10 48067

2 M 56 16 70072

3 M 25 15 55117

4 M 45 7 02460

5 M 25 20 55455

Time taken: 2.662 seconds, Fetched: 5 row(s)

hive>

要使用Beeline前需要先启动HiveServer2,启动过程中可以通过hiveconf设置相应的自定义参数和值,直接启动会占据当前连接会话,第一次可以直接启动,正常启动后可以切换至后台运行方式启动。

# 直接启动

[root@node225 ~]# /usr/local/hive-2.1.1/bin/hiveserver2 --hiveconf hive.server2.thrift.prot=10000

# 后台运行方式启动

[root@node225 ~]# /usr/local/hive-2.1.1/bin/hiveserver2 --hiveconf hive.server2.thrift.prot=10000 2>&1 >> /dev/null &

#或者

#分别记录标准日志输出和错误日志

nohup /usr/local/hive-2.1.1/bin/hiveserver2 --hiveconf hive.server2.thrift.prot=10000 1>/usr/local/hive-2.1.1/hivelog/hiveserver.log 2>/usr/local/hive-2.1.1/hivelog/hiveserver.err &

#不记录日志

nohup /usr/local/hive-2.1.1/bin/hiveserver2 --hiveconf hive.server2.thrift.prot=10000 1>/dev/null 2>/dev/null &

nohup /usr/local/hive-2.1.1/bin/hiveserver2 --hiveconf hive.server2.thrift.prot=10000 >/dev/null 2>&1 &

beeline的使用

-n 指定机器登陆的名字,当前机器的登陆用户名

-u 指定一个连接串

每成功运行一个命令,hiveserver2启动的那个窗口,只要在启动beeline的窗口中执行成功一条命令,另外个窗口随即打印一个OK如果命令错误,hiveserver2那个窗口就会抛出异常

# beeline连接hive

[root@node225 ~]# /usr/local/hive-2.1.1/bin/beeline -u jdbc:hive2://node225:10000/movie -n root

which: no hbase in (.:/usr/local/jdk1.8.0_66//bin:/usr/local/zookeeper-3.4.10/bin:ZK_HOME/sbin:ZK_HOME/lib:/usr/local/hadoop-2.6.5//bin:/usr/local/hadoop-2.6.5//sbin:/usr/local/hadoop-2.6.5//lib:/usr/local/hive-2.1.1/bin:/usr/local/mongodb/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin)

Connecting to jdbc:hive2://node225:10000/movie

Connected to: Apache Hive (version 2.1.1)

Driver: Hive JDBC (version 2.1.1)

18/10/09 14:03:00 [main]: WARN jdbc.HiveConnection: Request to set autoCommit to false; Hive does not support autoCommit=false.

Transaction isolation: TRANSACTION_REPEATABLE_READ

Beeline version 2.1.1 by Apache Hive

0: jdbc:hive2://node225:10000/movie> select current_database();

+----------------+--+

| database_name |

+----------------+--+

| db_hive_edu |

| default |

| movie |

+----------------+--+

3 rows selected (1.293 seconds)

可以在相同局域网内的其他部署hive的节点上通过Beelin连接指定的HiveServer2服务,进行多用户操作。

退出beeline连接用!quit

最后

以上就是凶狠过客为你收集整理的hiveserver2 和beeline_Hive2.x、HiveServer、HiveServer2简述及Beeline使用的全部内容,希望文章能够帮你解决hiveserver2 和beeline_Hive2.x、HiveServer、HiveServer2简述及Beeline使用所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(56)

评论列表共有 0 条评论

立即
投稿
返回
顶部