大数据hadoop之 五十八.Hue安装与配置
本文于2083天之前发表,文中内容可能已经过时。
Hue介绍
Hue是hadoop的cdh版本专门的一套web管理器,它包括3个部分hue ui,hue server,hue db。hue提供所有的cdh组件的shell界面的接口。你可以在hue编写mr,查看修改hdfs的文件,管理hive的元数据,运行Sqoop,编写Oozie工作流等大量工作。
HUE官方地址http://gethue.com/
- 默认基于轻量级sqlite数据库管理会话数据,用户认证和授权,可以自定义为MySQL、Postgresql,以及Oracle
- 基于文件浏览器(File Browser)访问HDFS
- 基于Hive编辑器来开发和运行Hive查询
- 支持基于Solr进行搜索的应用,并提供可视化的数据视图,以及仪表板(Dashboard)
- 支持基于Impala的应用进行交互式查询
- 支持Spark编辑器和仪表板(Dashboard)
- 支持Pig编辑器,并能够提交脚本任务
- 支持Oozie编辑器,可以通过仪表板提交和监控Workflow、Coordinator和Bundle
- 支持HBase浏览器,能够可视化数据、查询数据、修改HBase表
- 支持Metastore浏览器,可以访问Hive的元数据,以及HCatalog
- 支持Job浏览器,能够访问MapReduce Job(MR1/MR2-YARN)
- 支持Job设计器,能够创建MapReduce/Streaming/Java Job
- 支持Sqoop 2编辑器和仪表板(Dashboard)
- 支持ZooKeeper浏览器和编辑器
- 支持MySql、PostGresql、Sqlite和Oracle数据库查询编辑器
Hue安装
环境说明
操作系统:Ubuntu 14.04
集群节点:
- Master
- slave1
- slave2
hadoop用户为:root
这里我们将hue安装在Slave2节点上
安装编译hue需要的相关依赖
1 | sudo apt-get install ant gcc g++ libkrb5-dev libffi-dev libmysqlclient-dev libssl-dev libsasl2-dev libsasl2-modules-gssapi-mit libsqlite3-dev libtidy-0.99-0 libxml2-dev libxslt-dev make libldap2-dev maven python-dev python-setuptools libgmp3-dev |
下载解压并移动
到官网下载对应tar包
1 | root@slave2:~$ sudo tar zxvf hue-3.10.0.tgz |
编译
1 | root@slave2:~$ cd /usr/local/hue |
添加hue用户并赋权
1 | root@slave2:/usr/local/hue# sudo adduser hue |
启动hue
1 | root@slave2:/usr/local/hue# ./build/env/bin/supervisor |
打开slave2:8888查看到hue界面,代表hue安装成功。
下一步就是配置hue,使它能够管理hdfs、hive、hbase,并能使用Oozie、Pig等,将在下面的文章中给大家介绍。
Hue配置
配置集群的访问权限
由于hue的启动用户是hue,所以需要为hue添加集群的访问权限,在各节点的/usr/local/hadoop/etc/hadoop/core-site.xml,添加如下参数:
1 | <property> |
配置完,记得重启hadoop集群
配置hdfs
配置/usr/local/hue/desktop/conf/hue.ini
1)配置hdfs的超级用户
1 | # This should be the hadoop cluster admin |
2)hdfs相关配置
这里主要配置三项:fs_defaultfs、webhdfs_url、hadoop_conf_dir;
其中,webhdfs_url默认本身就是开启的,不需要在hadoop中特别开启。
1 | [[hdfs_clusters]] |
配置yarn
配置/usr/local/hue/desktop/conf/hue.ini;
主要配置四个地方:resourcemanager_host、resourcemanager_api_url、proxy_api_url、history_server_api_url。
1 | [[yarn_clusters]] |
配置hive
1)首先配置hue.ini
主要配置两个地方:hive_server_host、hive_conf_dir。
1 | [beeswax] |
2)启动hive2
1 | root@Master:/usr/local/hive/bin# hive --service hiveserver2 & |
配置hbase
1)首先配置hue.ini
主要配置两个地方:hbase_clusters、hbase_conf_dir。
1 | [hbase] |
2)启动thrift
1 | root@Master:/usr/local/hbase/bin# hbase-daemon.sh start thrift |
特别注意:这里的thrift必须是1,而不是thrift2
启动hue
1 | root@slave2:/usr/local/hue# ./build/env/bin/supervisor |
打开slave2:8888/about/查看到hue界面,如果页面中没有报hdfs、yarn、hbase、hive相关的警告则代表配置成功,之后就能在hue中使用相关的功能。
但是,我们可能会看到如下警告:
1 | SQLITE_NOT_FOR_PRODUCTION_USE SQLite is only recommended for small development environments with a few users. |
那是由于我们没有安装和配置相应功能,该块内容,将在后续文章中补充。