我是靠谱客的博主 怡然天空,最近开发中收集的这篇文章主要介绍Hive 数据库相关基本语法,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

创建数据库:

hive> create database if not exists hive2;
OK
Time taken: 0.257 seconds
hive> drop table hive2;
OK
Time taken: 0.224 seconds

创建存在的数据库,系统会报错:

hive> create database hive2;
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. Database hive2 already exists

避免创建重复的数据库,系统报错,可以使用如下的语句:

hive> create database if not exists hive2;
OK
Time taken: 0.031 seconds
删除数据库:

hive> drop databses hive2;
数据库所在目录默认是hive.metastore.warehouse.dir 指定的目录,例如:

<property>
<name>hive.metastore.warehouse.dir</name>
<value>/user/hive/warehouse</value>
<description>location of default database for the warehouse</description>
</property>

创建数据库时,如果不指定目录,数据将存储在 /user/hive/warehouse 这个子目录中,创建数据库时也可以指定目录,例如:

hive> create database hive2 location '/user/hive/databaseDir/';
OK
Time taken: 0.071 seconds

在hdfs中如下格式,是以 .db 结尾的
创建数据库时可以为数据库添加描述信息:

hive> create database hive3 comment 'test database comment';
OK
Time taken: 0.056 seconds
使用describe database database_name 能够查看描述语句以及数据库所在的文件目录位置:

hive> describe database hive3;
OK
db_name	comment	location	owner_name	owner_type	parameters
hives	test database comment	hdfs://localhost:9000/user/hive/warehouse/hive3.db	hadoop	USER
Time taken: 0.033 seconds, Fetched: 1 row(s)
创建数据库时可以指定键值对信息:
hive> create database hive4 with dbproperties('creator' = 'root','date'= '2017-04-24');
OK
Time taken: 0.066 seconds
同过describe database extended database_name 语句可以查看:

hive> describe database extended hive4;
OK
db_name	comment	location	owner_name	owner_type	parameters
hive4
hdfs://localhost:9000/user/hive/warehouse/hive4.db	hadoop	USER	{date=2017-04-24, creator=root}
Time taken: 0.031 seconds, Fetched: 1 row(s)
hive 没有命令可以查看当前使用的是哪个数据库,这个很遗憾。但是可以通过设置
hive.cli.print.current.db=true 显示出当前使用的数据库。

hive> set hive.cli.print.current.db=true;
hive (default)> use hive2;
OK
Time taken: 0.024 seconds
hive (hive2)> use default;
OK
Time taken: 0.027 seconds
删除数据库HQL:

hive (default)> drop database if exists hive2;
OK
Time taken: 0.054 seconds
默认情况下,hive不允许删除非空的数据库:

hive (default)> use hive4;
OK
Time taken: 0.022 seconds
hive (hive4)> create table T1(name string,age int);
OK
Time taken: 0.15 seconds
hive (hive4)> drop database hive4;
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. InvalidOperationException(message:Database hive4 is not empty. One or more tables exist.)

可以在语句后加上关键字cascade关键字,这样可以让hive先删除数据库中的表,然后再删除数据库:
hive (hive4)> drop database hive4 cascade;
OK
Time taken: 2.202 seconds
提示符这里是不会自动刷新的,可以切到其他数据库,再切到hive4 的时候,将会报错:
hive (hive4)> use default;
OK
Time taken: 0.026 seconds
hive (default)> use hiv4;
FAILED: SemanticException [Error 10072]: Database does not exist: hiv4
注意:数据库删除后,对应的目录也会被删除,hive4.db 目录不存在了


最后

以上就是怡然天空为你收集整理的Hive 数据库相关基本语法的全部内容,希望文章能够帮你解决Hive 数据库相关基本语法所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(43)

评论列表共有 0 条评论

立即
投稿
返回
顶部