我是靠谱客的博主 孤独音响,最近开发中收集的这篇文章主要介绍Hive中的数据模型,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

Hive 中主要包括 4 种数据模型:表(Table)外部表(External Table)分区(Partition)以及 桶(Bucket)

Hive 的表和数据库中的表在概念上没有什么本质区别,在 Hive 中每个表都有一个对应的存储目录。

外部表指向已经在 HDFS 中存在的数据,也可以创建分区。

Hive 中的每个分区都对应数据库中相应分区列的一个索引,但是其对分区的组织方式和传统关系数据库不同。

桶在指定列进行 Hash 计算时,会根据哈希值切分数据,使每个桶对应一个文件。

最后

以上就是孤独音响为你收集整理的Hive中的数据模型的全部内容,希望文章能够帮你解决Hive中的数据模型所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(50)

评论列表共有 0 条评论

立即
投稿
返回
顶部