Hadoop系统入门之数据仓库Hive
Hive产生的背景:MapReduce编程的不方便传统关系型数据库的需要Hive概述之Hive是什么由Facebook开源,用与解决海量结构化日志的数据统计问题。构建再Hadoop之上的数据仓库。Hive提供的SQL查询语言: HQL。底层支持多种不同的执行引擎。HDFS上的文件并没有schema(数据组织结构)的概念。Hive底层执行引擎支持: MR/Tez/Sperk.统一元数据管理:Hive数据是存放在HDFS.元数据信息(记录数据的数据)是存放在MySQL中。SQL on