我是靠谱客的博主 虚幻小蝴蝶,最近开发中收集的这篇文章主要介绍hive表指定分区字段搜索_05_Hive分区总结,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

2.1.创建分区表并将本地文件的数据加载到分区表:

使用下面的命令来创建一个带分区的表

通过partitioned by(country string)关键字声明该表是分区表,且分区字段不能为create table时存在的字段。此

时只能说指定了这个表会分区,但是具体数据有哪些分区则会在导入数据时产生

使用下面的命令来指定具体导入到哪个分区:

查询该分区表:select * from t_part;

此时分区字段已经变成一个伪字段了。如果要分区查询,可以使用Where或者Group by来进行限定;

2.2.Hive中上传数据:

之前我们直接将数据文件上传到了Hive表所在的数据目录,其实Hive还提供了一个Load命令供我们将数据进行上传

语法结构:Load

LOAD DATA [LOCAL] INPATH 'filepath'[OVERWRITE] INTO

TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]

参数说明:

Load 操作只是单纯的复制/移动操作,将数据文件移动到 Hive 表对应的位置。

filepath:

相对路径,例如:project/data1

绝对路径,例如:/user/hiv

最后

以上就是虚幻小蝴蝶为你收集整理的hive表指定分区字段搜索_05_Hive分区总结的全部内容,希望文章能够帮你解决hive表指定分区字段搜索_05_Hive分区总结所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(40)

评论列表共有 0 条评论

立即
投稿
返回
顶部