概述
Hive——元数据表含义
1、VERSION -- 查询版本信息
Field | Type | Comment | |
---|---|---|---|
VER_ID | bigint(20) | ID主键 | |
SCHEMA_VERSION | varchar(127) | Hive版本 | |
VERSION_COMMENT | varchar(255) | 版本说明 |
2、DBS -- 存储Hive中所有数据库的基本信息
Field | Type | Comment | |
---|---|---|---|
DB_ID | bigint(20) | 数据库ID | |
DESC | varchar(4000) | 数据库描述 | |
DB_LOCATION_URI | varchar(4000) | 数据库HDFS路径 | |
NAME | varchar(128) | 数据库名 | |
OWNER_NAME | varchar(128) | 数据库所有者用户名 | |
OWNER_TYPE | varchar(10) | 所有者角色 |
3、DATABASE_PARAMS --该表存储数据库的相关参数,在CREATE DATABASE时候用
Field | Type | Comment | |
---|---|---|---|
DB_ID | bigint(20) | 数据库ID | |
PARAM_KEY | varchar(180) | 参数名 | |
PARAM_VALUE | varchar(4000) | 参数值 |
4、TBLS --该表中存储Hive表、视图、索引表的基本信息
Field | Type | Comment | |
---|---|---|---|
TBL_ID | bigint(20) | 表ID | |
CREATE_TIME | int(11) | 创建时间 | |
DB_ID | bigint(20) | 数据库ID | |
LAST_ACCESS_TIME | int(11) | 上次访问时间 | |
OWNER | varchar(767) | 所有者 | |
RETENTION | int(11) | 保留字段 | |
SD_ID | bigint(20) | 序列化配置信息 | |
TBL_NAME | varchar(128) | 表名 | |
TBL_TYPE | varchar(128) | 表类型 | |
VIEW_EXPANDED_TEXT | mediumtext | 视图的详细HQL语句 | |
VIEW_ORIGINAL_TEXT | mediumtext | 视图的原始HQL语句 |
5、TABLE_PARAMS --该表存储表/视图的属性信息。
Field | Type | Comment | |
---|---|---|---|
TBL_ID | bigint(20) | 表ID | |
PARAM_KEY | varchar(256) | 属性名 | |
PARAM_VALUE | varchar(4000) | 属性值 |
6、SDS --该表保存文件存储的基本信息,如INPUT_FORMAT、OUTPUT_FORMAT、是否压缩等。
Field | Type | Comment | |
---|---|---|---|
SD_ID | bigint(20) | 存储信息ID | |
CD_ID | bigint(20) | 字段信息ID | |
INPUT_FORMAT | varchar(4000) | 文件输入格式 | |
IS_COMPRESSED | bit(1) | 是否压缩 | |
IS_STOREDASSUBDIRECTORIES | bit(1) | 是否以子目录存储 | |
LOCATION | varchar(4000) | HDFS路径 | |
NUM_BUCKETS | int(11) | 分桶数量 | |
OUTPUT_FORMAT | varchar(4000) | 文件输出格式 | |
SERDE_ID | bigint(20) | 序列化类ID |
7、SERDS --该表存储序列化使用的类信息
Field | Type | Comment | |
---|---|---|---|
SERDE_ID | bigint(20) | 序列化类配置ID | |
NAME | varchar(128) | 序列化类别名 | |
SLIB | varchar(4000) | 序列化类 |
8、SERDE_PARAMS --该表存储序列化的一些属性、格式信息,比如:行、列分隔符
Field | Type | Comment | |
---|---|---|---|
SERDE_ID | bigint(20) | 序列化类配置ID | |
PARAM_KEY | varchar(256) | 属性名 | |
PARAM_VALUE | varchar(4000) | 属性值 |
9、COLUMNS_V2 --该表存储表对应的字段信息。
Field | Type | Comment | |
---|---|---|---|
CD_ID | bigint(20) | 字段信息ID | |
COMMENT | varchar(256) | 字段注释 | |
COLUMN_NAME | varchar(128) | 字段名 | |
TYPE_NAME | varchar(4000) | 字段类型 | |
INTEGER_IDX | int(11) | 字段顺序 |
10、PARTITIONS --该表存储表分区的基本信息。
Field | Type | Comment | |
---|---|---|---|
PART_ID | bigint(20) | 分区ID | |
CREATE_TIME | int(11) | 分区创建时间 | |
LAST_ACCESS_TIME | int(11) | 最后一次访问时间 | |
PART_NAME | varchar(767) | 分区名 | |
SD_ID | bigint(20) | 分区存储ID | |
TBL_ID | bigint(20) | 表ID |
11、PARTITION_KEYS --该表存储分区的字段信息。
Field | Type | Comment | |
---|---|---|---|
TBL_ID | bigint(20) | 表ID | |
PKEY_COMMENT | varchar(4000) | 分区字段说明 | |
PKEY_NAME | varchar(128) | 分区字段名 | |
PKEY_TYPE | varchar(767) | 分区字段类型 | |
INTEGER_IDX | int(11) | 分区字段顺序 |
12、PARTITION_KEY_VALS --该表存储分区字段值。
Field | Type | Comment | |
---|---|---|---|
PART_ID | bigint(20) | 分区ID | |
PART_KEY_VAL | varchar(255) | 分区字段值 | |
INTEGER_IDX | int(11) | 分区字段值顺序 |
13、PARTITION_PARAMS --该表存储分区的属性信息。
Field | Type | Comment | |
---|---|---|---|
PART_ID | bigint(20) | 分区ID | |
PARAM_KEY | varchar(256) | 分区属性名 | |
PARAM_VALUE | varchar(4000) | 分区属性值 |
其他不常用的元数据表:
DB_PRIVS:数据库权限信息表。通过GRANT语句对数据库授权后,将会在这里存储。
IDXS:索引表,存储Hive索引相关的元数据
INDEX_PARAMS:索引相关的属性信息。
TAB_COL_STATS:表字段的统计信息。使用ANALYZE语句对表字段分析后记录在这里。
TBL_COL_PRIVS:表字段的授权信息
PART_PRIVS:分区的授权信息
PART_COL_STATS:分区字段的统计信息。
PART_COL_PRIVS:分区字段的权限信息。
FUNCS:用户注册的函数信息
FUNC_RU:用户注册函数的资源信息
转载于:https://www.cnblogs.com/jnba/p/10673728.html
最后
以上就是合适康乃馨为你收集整理的Hive——元数据表含义的全部内容,希望文章能够帮你解决Hive——元数据表含义所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复