我是靠谱客的博主 不安蜻蜓,最近开发中收集的这篇文章主要介绍企业大数据平台搭建(二)集群管理工具CM 5.3.x安装,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

一、下载文件和上传到主机

安装方式:断网,rpm安装,yum本地源

生产环境的集群要断网;

rpm会自动安装到相应的目录,不用手动设置;

rpm软件下载地址:http://archive.cloudera.com/cm5/

需要下载的软件:

必须软件:

1)cm-5.3.6 bin安装文件,

下载地址:http://archive.cloudera.com/cm5/installer/5.3.6/cloudera-manager-installer.bin

2)cm-5.3.6 依赖rpm包,

下载地址:http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5.3.6/RPMS/x86_64/

下载以上目录下的所有rpm文件;

NameLast ModifiedSize
Parent Directory
cloudera-manager-agent-5.3.6-1.cm536.p0.244.el6.x86_64.rpm2015-07-31 14:373.8 MB
cloudera-manager-daemons-5.3.6-1.cm536.p0.244.el6.x86_64.rpm2015-07-31 14:37476.3 MB
cloudera-manager-server-5.3.6-1.cm536.p0.244.el6.x86_64.rpm2015-07-31 14:377.7 KB
cloudera-manager-server-db-2-5.3.6-1.cm536.p0.244.el6.x86_64.rpm2015-07-31 14:379.7 KB
enterprise-debuginfo-5.3.6-1.cm536.p0.244.el6.x86_64.rpm2015-07-31 14:37676.8 KB
jdk-6u31-linux-amd64.rpm2015-07-31 14:3767.9 MB
oracle-j2sdk1.7-1.7.0+update67-1.x86_64.rpm2015-07-31 14:37135.5 MB

还要下载其他的包:

依赖其他的包 postgresql-libs 和 repo-libs;

postgresql 是一种数据库(与mysql非常相似),cm的数据存放在 postgresql;

repo-libs 包用于搭建本地源;

(1)postgresql-libs

postgresql-8.4.18-1.el6_4.x86_64.rpm

postgresql-libs-8.4.18-1.el6_4.x86_64.rpm

postgresql-server-8.4.18-1.el6_4.x86_64.rpm

下载地址(可以下载但速度很慢):

http://rpm.pbone.net/index.php3/stat/4/idpl/24235889/dir/scientific_linux_6/com/postgresql-8.4.18-1.el6_4.x86_64.rpm.html

http://rpm.pbone.net/index.php3/stat/4/idpl/24235895/dir/scientific_linux_6/com/postgresql-libs-8.4.18-1.el6_4.x86_64.rpm.html

http://rpm.pbone.net/index.php3/stat/4/idpl/24235935/dir/scientific_linux_6/com/postgresql-server-8.4.18-1.el6_4.x86_64.rpm.html

(2)repo-libs

createrepo-0.9.9-18.el6.noarch.rpm

deltarpm-3.5-0.5.20090913git.el6.x86_64.rpm

python-deltarpm-3.5-0.5.20090913git.el6.x86_64.rpm

下载地址(可以下载但速度很慢):

http://rpm.pbone.net/index.php3?stat=26&dist=77&size=95480&name=createrepo-0.9.9-18.el6.noarch.rpm.html

http://rpm.pbone.net/index.php3?stat=26&dist=77&size=71584&name=deltarpm-3.5-0.5.20090913git.el6.x86_64.rpm.html

http://rpm.pbone.net/index.php3?stat=26&dist=77&size=26808&name=python-deltarpm-3.5-0.5.20090913git.el6.x86_64.rpm.html

 

cm只要安装在一台机器上就可以,选择安装在主机器:

bigdata-cdh01.ibeifeng.com

 

在 bigdata-cdh01 主机上,创建 /opt/softwares,并改变拥有者为用户 beifeng;

并在softwares目录下,创建其他目录,如下所示:

# cd /opt
# mkdir softwares
# sudo chown -R beifeng:beifeng ./softwares/
# cd softwares
# mkdir cdh-5.3.6
# mkdir cm-5.3.6
# mkdir postgresql-libs
# mkdir repo-libs

用filezilla把以上下载的文件,发送到bigdata-cdh01主机上的对应目录:

$ cd cm-5.3.6/
$ ls
cloudera-manager-agent-5.3.6-1.cm536.p0.244.el6.x86_64.rpm
cloudera-manager-daemons-5.3.6-1.cm536.p0.244.el6.x86_64.rpm
cloudera-manager-installer.bin
cloudera-manager-server-5.3.6-1.cm536.p0.244.el6.x86_64.rpm
cloudera-manager-server-db-2-5.3.6-1.cm536.p0.244.el6.x86_64.rpm
enterprise-debuginfo-5.3.6-1.cm536.p0.244.el6.x86_64.rpm
jdk-6u31-linux-amd64.rpm
oracle-j2sdk1.7-1.7.0+update67-1.x86_64.rpm
$ cd postgresql-libs/
$ ls
postgresql-8.4.18-1.el6_4.x86_64.rpm
postgresql-server-8.4.18-1.el6_4.x86_64.rpm
postgresql-libs-8.4.18-1.el6_4.x86_64.rpm
$ cd repo-libs/
$ repo-libs]$ ls
createrepo-0.9.9-18.el6.noarch.rpm
python-deltarpm-3.5-0.5.20090913git.el6.x86_64.rpm
deltarpm-3.5-0.5.20090913git.el6.x86_64.rpm

二、搭建yum本地源

接下来在 bigdata-cdh01.ibeifeng.com 搭建 yum 本地源;使得本主机作为服务器,使得安装rpm文件时,不用连外网下载;

1、Apache 服务器

检查有没有装apache服务器,在不同的Linux 版本上,预装的apache版本,有apache 1 或 apache 2;

httpd 就是 apache 服务器;

检查已经有装apache服务器;版本是2;

$ rpm -qa | grep httpd
httpd-tools-2.2.15-26.el6.centos.x86_64
httpd-2.2.15-26.el6.centos.x86_64

检查状态;状态是关闭;

$ sudo service httpd status
httpd is stopped

启动apache服务器;

$ sudo service httpd start
Starting httpd:
[
OK
]
$ sudo service httpd status
httpd (pid
2760) is running...

设置为永久启动:

sudo chkconfig httpd on

在宿主机器配置域名映射:

vi /etc/hosts
## 20191204 add bigdata cluster hosts mapping
192.168.178.137
bigdata-cdh01.ibeifeng.com
bigdata-cdh01
192.168.178.138
bigdata-cdh02.ibeifeng.com
bigdata-cdh02
192.168.178.139
bigdata-cdh03.ibeifeng.com
bigdata-cdh03

在宿主机器浏览器打开 ,访问 bigdata-cdh01.ibeifeng.com 主机的apache服务器;(默认端口是80);

http://bigdata-cdh01.ibeifeng.com/

可以成功访问

 

apache服务器的文件目录如下:

$ cd /var/www/html/

在该文件目录下的文件,都可以通过浏览器访问:

比如创建一个test目录,在浏览器访问:

在 /var/www/html 目录下创建目录:

sudo mkdir -p cm5/redhat/6/x86_64/cm/5.3.6/RPMS/x86_64/

并把 /opt/softwares/cm-5.3.6 目录下除了 cloudera-manager-installer.bin 之外的其他rpm文件,移动到cm5/redhat/6/x86_64/cm/5.3.6/RPMS/x86_64/ 目录;

$ cd /var/www/html/cm5/redhat/6/x86_64/cm/5.3.6/RPMS/x86_64
$ mv /opt/softwares/cm-5.3.6/* .
$ ls
cloudera-manager-agent-5.3.6-1.cm536.p0.244.el6.x86_64.rpm
cloudera-manager-daemons-5.3.6-1.cm536.p0.244.el6.x86_64.rpm
cloudera-manager-server-5.3.6-1.cm536.p0.244.el6.x86_64.rpm
cloudera-manager-server-db-2-5.3.6-1.cm536.p0.244.el6.x86_64.rpm
enterprise-debuginfo-5.3.6-1.cm536.p0.244.el6.x86_64.rpm
jdk-6u31-linux-amd64.rpm
oracle-j2sdk1.7-1.7.0+update67-1.x86_64.rpm

在宿主浏览器访问 http://bigdata-cdh01.ibeifeng.com/cm5/redhat/6/x86_64/cm/5.3.6/RPMS/x86_64/,可以看到以上文件,

同时访问外网的http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5.3.6/RPMS/x86_64/,可以发现文件路径和文件一致:

运行yum命令是,会根据resps.d 目录下的文件,再找到对应的网站取下载;

设置了本地yum源,所以要删除resps.d 目录下的文件;

$ cd /etc/yum.repos.d/
$ ls
CentOS-Base.repo
CentOS-Debuginfo.repo
CentOS-Media.repo
CentOS-Vault.repo
$ sudo rm -rf ./*

再创建源文件:

复制外网官网的文件内容:http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/cloudera-manager.repo

在目录下新建文件,

$ sudo touch cloudera-manager.repo
$ sudo vi cloudera-manager.repo

粘贴复制的官网文件cloudera-manager.repo内容,做以下修改

删除这一行代码,否则下文安装会出错

gpgkey =https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/RPM-GPG-KEY-cloudera  

最终的文件内容为:

[cloudera-manager]
# Packages for Cloudera Manager, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera Manager
baseurl=https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5/
gpgcheck = 1

 

为了保持和cloudera-manager.repo文件里指定的baseurl一致, 把 cm5/redhat/6/x86_64/cm/5.3.6 改为 cm5/redhat/6/x86_64/cm/5

$ cd /var/www/html/cm5/redhat/6/x86_64/cm
$ ls
5.3.6
$ sudo mv 5.3.6 5
$ ls
5

 

为了测试yum源是否配置正确,在宿主机器改host映射,把archive.cloudera.com 改为指向 bigdata-cdh01.com 主机,

## 20191204 add cloudera maping
192.168.178.137
archive.cloudera.com

在宿主浏览器访问 http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5/RPMS/x86_64/

说明配置yum本地源成功;

三、安装依赖和cm

1、安装依赖postgrepsql 和 repo

进入softwares路径

首先安装依赖,postgrepsql,用户如果没有执行权限,需要先赋给执行权限:

执行rpm安装命令,会自动判定rpm包的安装顺序,

$ cd postgresql-libs
$ chmod u+x ./*
$ sudo rpm -ivh *.rpm
warning: postgresql-8.4.18-1.el6_4.x86_64.rpm: Header V4 DSA/SHA1 Signature, key ID 192a7d7d: NOKEY
Preparing...
########################################### [100%]
1:postgresql-libs
########################################### [ 33%]
2:postgresql
########################################### [ 67%]
3:postgresql-server
########################################### [100%]

2、安装依赖repo

用户如果没有执行权限,需要先赋给执行权限:

在执行安装命令,如下所示安装成功

cd repo-libs
chmod u+x ./*
sudo rpm -ivh *.rpm
warning: createrepo-0.9.9-18.el6.noarch.rpm: Header V4 DSA/SHA1 Signature, key ID 192a7d7d: NOKEY
Preparing...
########################################### [100%]
1:deltarpm
########################################### [ 33%]
2:python-deltarpm
########################################### [ 67%]
3:createrepo
########################################### [100%]

再进入目录 /var/www/html/cm5/redhat/6/x86_64/cm/5,运行命令,生成repo;

会生成 repodata 目录,进入目录,有7个rpm包

$ cd /var/www/html/cm5/redhat/6/x86_64/cm/5
$ sudo createrepo .
$ ll
drwxr-xr-x 2 root root 4096 12月
5 10:22 repodata
drwxr-xr-x 3 root root 4096 12月
5 07:41 RPMS

3、安装cm

赋给当前用户执行权限,执行 cloudera-manager-installer.bin

$ cd cm-5.3.6/
$ ls
cloudera-manager-installer.bin
$ chmod u+x cloudera-manager-installer.bin
$ sudo ./cloudera-manager-installer.bin 

安装界面,一直按next,

一直按next,或者yes;

直到出现安装成功的界面,

提示访问的地址:http://bigdata-cdh01.ibeifeng.com:7180/

提示用户名和密码都是:admin

安装过程中失败常见的原因(作为参考)

  1、seLinux出于打开状态,设置的disabled没有生效。(设置好,然后重启机器就好)

  2、防火墙出于打开状态

  3、postgresql数据库没有安装或者服务没有启动

  4、httpd服务没有打开或者配置的baseurl地址不可用

四、登录cm

打开界面,用户名和密码都是:admin,登录

可以看到有3个版本,选择免费的那个,点 继续,

提示可使用的软件包,以及是否需要许可证,

可以看到要求添加主机;这里先不添加主机;

点击左上角的 “cloudera manager”,进去主界面

可以看到主界面,点击“管理”,再点击“设置”

可以看到设置的类别;点击“Parcel”,找到属性:本地Parcel 存储库路径,这是个默认值;可以修改;复制默认值;

 

bigdata-cdh01.ibeifeng.com 主机,进入该目录,该目录已经存在,安装CM时已经自动创建好,

$ cd /opt/cloudera/parcel-repo

 

五、下载 CDH

官网下载2个文件,

下载地址:http://archive.cloudera.com/cdh5/parcels/5.3.6/

文件:CDH-5.3.6-1.cdh5.3.6.p0.11-el6.parcel   和  CDH-5.3.6-1.cdh5.3.6.p0.11-el6.parcel.sha1

把上文下载的2个文件,存放到 /opt/cloudera/parcel-repo 目录下:

$ cd parcel-repo/
$ ls
CDH-5.3.6-1.cdh5.3.6.p0.11-el6.parcel
CDH-5.3.6-1.cdh5.3.6.p0.11-el6.parcel.sha1

重命名,把后缀 sha1 改为 sha

$ sudo mv CDH-5.3.6-1.cdh5.3.6.p0.11-el6.parcel.sha1 CDH-5.3.6-1.cdh5.3.6.p0.11-el6.parcel.sha

已经把cdh包放到 parcel 指定存储目录下;但由于更新频率是1小时;所以还不能被识别安装;为了被识别安装,所以要重启cm;

重启cm服务

查看cm当前状态

$ sudo service cloudera-scm-server status
cloudera-scm-server (pid
4422) is running...

重启cm服务

$ sudo service cloudera-scm-server restart
Stopping cloudera-scm-server:
[
OK
]
Starting cloudera-scm-server:
[
OK
]
$ sudo service cloudera-scm-server status
cloudera-scm-server (pid
5725) is running...

 

以上是在 bigdata-cdh01 主机上安装了cloudera server;

还需要在以下3台主机上安装 cloudera agent:bigdata-cdh01,bigdata-cdh02,bigdata-cdh03;

注意:在 bigdata-cdh01 主机上同时安装 cloudera server 和 cloudera agent;

 

修改bigdata-cdh01 主机上的 /etc/yum.repos.d/cloudera-manager.repo 文件,把地址指向bigdata-cdh01主机,把gpgcheck检查设置为0(不检查),最终内容如下:

[cloudera-manager]
name=Cloudera Manager
baseurl=http://bigdata-cdh01.ibeifeng.com/cm5/redhat/6/x86_64/cm/5/
enabled=1
gpgcheck=0

把 bigdata-cdh01 主机上的 /etc/yum.repos.d/cloudera-manager.repo 文件,复制到  bigdata-cdh02 主机 和 bigdata-cdh03 主机上的 /etc/yum.repos.d 目录下,使得 bigdata-cdh02 主机 和 bigdata-cdh03 主机 安装 cloudera agent 时,下载文件指向 bigdata-cdh01 主机;

对bigdata-cdh02 主机 和 bigdata-cdh03 主机分别做以下操作:

把 /etc/yum.repos.d 目录下的所有文件删除,新建 cloudera-manager.repo 文件,内容和 bigdata-cdh01主机上的  cloudera-manager.repo 文件一致;

$ cd /etc/yum.repos.d/
$ ls
CentOS-Base.repo
CentOS-Debuginfo.repo
CentOS-Media.repo
CentOS-Vault.repo
$ sudo rm -rf ./*
$ sudo vi cloudera-manager.repo
[cloudera-manager]
name=Cloudera Manager
baseurl=http://bigdata-cdh01.ibeifeng.com/cm5/redhat/6/x86_64/cm/5/
enabled=1
gpgcheck=0

六、安装cdh

接下来在cm中添加主机

为 CDH 群集安装指定主机界面;点击“搜索”,

可以看到搜索规则

bigdata-cdh[01-03].ibeifeng.com 表示

bigdata-cdh01.ibeifeng.com,bigdata-cdh02.ibeifeng.com,bigdata-cdh03.ibeifeng.com

填入 bigdata-cdh[01-03].ibeifeng.com,点击右下角的“搜索”

会自动搜索主机,点击继续:

选择存储库;

可以看到已经搜素到cdh版本的目录;

为cloudera agent指定安装目录的存储目录;

点 继续;

JDK 安装选项;

由于前文在准备机器时,已经把预装的jdk卸载,所以要安装jdk;

选中第一个 “安装 oracle java se 开发工具”;第二个不用勾选;

点击继续;

这一步不做勾选;

点击 继续;

提供SSH 登录凭据;

3台机器都有普通用户 beifeng;

并且beifeng用户的密码都相同;

并且beifeng用户都有sudo权限;

这样,会自动取设置3台主机之间beifeng用户的SSH免密登录,相互之间用beifeng用户访问不用输入密码;

点击继续;

正在安装;

jkd 和 cloudera agent 安装完毕;

点击继续;

正在安装选定 Parcel;

安装目录在每台主机的: /opt/cloudera/parcels/CDH

安装目录在每台主机的: /opt/cloudera/parcels/CDH

在 /opt/cloudera/parcels/CDH/lib 目录下可以看到各个组件的 lib 包:

安装完成,点继续;

检查主机正确性:

检查有3个问题,必须要修改,才能继续往下执行;

改完之后点击 左上角的 “重新运行”;

直到不报错;

点击右下角的 完成;

出现的问题:

问题2、Cloudera 建议将 /proc/sys/vm/swappiness 设置为 0。当前设置为 60。使用 sysctl 命令在运行时更改该设置并编辑 
/etc/sysctl.conf 以在重启后保存该设置。您可以继续进行安装,但可能会遇到问题,
Cloudera Manager 报告您的主机由于交换运行状况不佳。以下主机受到影响: 
bigdata-cdh[01-03].ibeifeng.com

问题的解决:

在每台主机上运行命令:

$ sudo sysctl -w vm.swappiness=0

永久生效:

需要切换到root用户,编辑文件加上代码:

$ su root
密码:
# echo "vm.swappiness=0" >> /etc/sysctl.conf

问题3、已启用“透明大页面”,它可能会导致重大的性能问题。版本为“CentOS release 6.4 (Final)”且发行版为“2.6.32-358.el6.x86_64”的 Kernel 已将 enabled 设置为“[always] never”,并将 defrag 设置为“[always] never”。请运行“echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag”以禁用此设置,然后将同一命令添加到一个 init 脚本中,如 /etc/rc.local,这样当系统重启时就会予以设置。或者,升级到 RHEL 6.5 或更新版本,它们不存在此错误。将会影响到以下主机: 

bigdata-cdh[01-03].ibeifeng.com

这个问题,属于centos的bug问题,但是可以修复;

问题的解决:

每台主机都操作;首先切换到root用户;执行命令 echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag;

再切换到 beifeng用户;sudo命令编辑文件 /etc/rc.local,

在文件最后加上 echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag

$ su root
密码:
# echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag
# exit
$ sudo vi /etc/rc.local
echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag

至此完成server 和 agent 的安装;主界面如下:

 

最后

以上就是不安蜻蜓为你收集整理的企业大数据平台搭建(二)集群管理工具CM 5.3.x安装的全部内容,希望文章能够帮你解决企业大数据平台搭建(二)集群管理工具CM 5.3.x安装所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(56)

评论列表共有 0 条评论

立即
投稿
返回
顶部