我是靠谱客的博主 舒服芹菜,最近开发中收集的这篇文章主要介绍离线数据系统之Hue详解,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

一、Hue简介

Hue是一个开源的Apache Hadoop UI系统,最早是由Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job等等。

总结:

  1. Hue是一个开源的Apache Hadoop UI系统。
  2. 通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。 例如操作HDFS上的数据、运行Hive脚本、管理Oozie任务等等。
  3. 基于Python Web框架Django实现的。
  4. 支持任何版本Hadoop

二、功能

  1. 默认基于轻量级sqlite数据库管理会话数据,用户认证和授权,可以自定义为MySQL、Postgresql,以及Oracle

  2. 基于文件浏览器(File Browser)访问HDFS

  3. 基于web编辑器来开发和运行Hive查询

  4. .支持Hive的元数据(metastore)查询

  5. 支持基于Solr进行搜索的应用,并提供可视化的数据视图,以及仪表板(Dashboard)

  6. 通过web调试和开发impala交互式查询

  7. 支持Spark编辑器和仪表板(Dashboard)

  8. 支持Pig编辑器,并能够提交脚本任务

  9. 支持Oozie编辑器,可以通过仪表板提交和监控Workflow、Coordinator和Bundle

  10. 支持HBase浏览器,能够可视化数据、查询数据、修改HBase表

  11. 支持Metastore浏览器,可以访问Hive的元数据,以及HCatalog

  12. 支持Job浏览器,能够访问MapReduce Job(MR1/MR2-YARN),任务进度查看,日志追踪

  13. 支持Job设计器,能够创建MapReduce/Streaming/Java Job

  14. 支持Sqoop 2编辑器和仪表板(Dashboard)

  15. 支持ZooKeeper浏览器和编辑器

  16. 支持MySql、PostGresql、Sqlite和Oracle数据库查询编辑器

三、Hue的原理及架构

原理:Hue相对于HDFS、MapReduce、Hive等为客户端,底层调用其封装的API,其目的是方便使用。

 

四、安装部署

  • 使用CDH,先安装Hive
  • 再安装oozie

  • 最后安装Hue(hdfs/hdfs)

五、Hue使用

  • 新建HDFS文件

  • 执行Hive 语句

 

 

 

最后

以上就是舒服芹菜为你收集整理的离线数据系统之Hue详解的全部内容,希望文章能够帮你解决离线数据系统之Hue详解所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(39)

评论列表共有 0 条评论

立即
投稿
返回
顶部