概述
一、Hue简介
Hue是一个开源的Apache Hadoop UI系统,最早是由Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job等等。
总结:
- Hue是一个开源的Apache Hadoop UI系统。
- 通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。 例如操作HDFS上的数据、运行Hive脚本、管理Oozie任务等等。
- 基于Python Web框架Django实现的。
- 支持任何版本Hadoop
二、功能
-
默认基于轻量级sqlite数据库管理会话数据,用户认证和授权,可以自定义为MySQL、Postgresql,以及Oracle
-
基于文件浏览器(File Browser)访问HDFS
-
基于web编辑器来开发和运行Hive查询
-
.支持Hive的元数据(metastore)查询
-
支持基于Solr进行搜索的应用,并提供可视化的数据视图,以及仪表板(Dashboard)
-
通过web调试和开发impala交互式查询
-
支持Spark编辑器和仪表板(Dashboard)
-
支持Pig编辑器,并能够提交脚本任务
-
支持Oozie编辑器,可以通过仪表板提交和监控Workflow、Coordinator和Bundle
-
支持HBase浏览器,能够可视化数据、查询数据、修改HBase表
-
支持Metastore浏览器,可以访问Hive的元数据,以及HCatalog
-
支持Job浏览器,能够访问MapReduce Job(MR1/MR2-YARN),任务进度查看,日志追踪
-
支持Job设计器,能够创建MapReduce/Streaming/Java Job
-
支持Sqoop 2编辑器和仪表板(Dashboard)
-
支持ZooKeeper浏览器和编辑器
-
支持MySql、PostGresql、Sqlite和Oracle数据库查询编辑器
三、Hue的原理及架构
原理:Hue相对于HDFS、MapReduce、Hive等为客户端,底层调用其封装的API,其目的是方便使用。
四、安装部署
- 使用CDH,先安装Hive
- 再安装oozie
- 最后安装Hue(hdfs/hdfs)
五、Hue使用
- 新建HDFS文件
- 执行Hive 语句
最后
以上就是舒服芹菜为你收集整理的离线数据系统之Hue详解的全部内容,希望文章能够帮你解决离线数据系统之Hue详解所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复