FusionInsight大数据开发---Hive应用开发

298 阅读 0 评论 197 点赞

我是靠谱客的博主糊涂酒窝，这篇文章主要介绍FusionInsight大数据开发---Hive应用开发，现在分享给大家，希望可以做个参考。

Hive应用开发

1. 了解Hive的基本架构原理
守护进程：

Hive的应用场景

2. 掌握JDBC客户端开发流程
JDBC开发-参数初始化

JDBC开发-拼接URL

JDBC开发-执行SQL

JDBC开发-SQL实现

规则建议：
开发调式：在开发程序时，可通过使用Hive的客户端Beeline先进行调试，检验语句与结果正确性，再部署基于JDBC等的应用程序。
获取数据库连接：Hive的数据库URL再拼接时已经经过安全认证，所以Hive数据库的用户名和密码为null或空。

JDBC超时限制:Hive提供的JDBC实现的超时限制，默认是5分钟。

执行HQL：再JAVA　JDBC应用开发中，拼装HQL语句，注意HQL语句不能以“;“结尾。

HQL语法规则之判空：判断字段为空使用：”is null“，判断不为空，即有值，使用："is not null"

UDF的管理：建议由管理员创建永久UDF，避免每次使用时都去add jar，和重新定义UDF。

UDF的注解：Hive的UDF会有一些默认属性。@UDFType(deterministic = false)

使用分区表：当数据量较大时，且经常需要按天统计时，建议使用分区表，按天存放数据。

动态分区表：为了避免插入动态分区数据过程中，产生过多的小文件，在执行插入时，在分区字段上加distribut by。

文件格式选择：Hive支持多种存储格式，比如TextFile,RCFile,ORC,Sequence,Parquet.

以上就是糊涂酒窝最近收集整理的关于FusionInsight大数据开发---Hive应用开发的全部内容，更多相关FusionInsight大数据开发---Hive应用开发内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。