概述
在配置hadoop、hbase集群监控的时候,开发测试环境都是很ok的,但是到了生产环境,由于安装位置在SF区,连不了外围,当然服务器也无法yum安装ganglia,导致产生了一系列问题。安装依赖包太多,页面显示不正常,hbase发送指标太多等众多问题
一、页面显示不正常原因
主要是下载的ganglia-web里依赖的一些js需要联网下载,服务器连不了外网,无法加载,故而导致界面显示不正常,解决方法,找一台可以连接外网的linux机器,直接yum安装ganglia-web,然后将/usr/share目录下的ganglia-web拷贝出来,放到/var/www/html目录下,顺便配置一下conf.php 即可
二、无法显示数据问题
当我将几十台机器装完后,发现有些显示收据,有些不显示数据,但是host数是那么多,正常,但是图表没有数据真是一个大bug,当时为了这事还加了一天班。后来发现时gmetad配置的时候是将大写自动转换成小写,就在那个rrds目录下存储数据的目录名称,是按照各机器的hostname来标识的,有些hostname是大写,自动转换成小写,导致找不到数据。解决办法是配置gmetad.conf文件,默认是“case_sensitive_hostnames 0”,改为“case_sensitive_hostnames 1”即可。
三、hbase发送指标过多问题
在配置hbase后,发现发送的指标真多,界面根本无法正常显示。指标太多了, 到region级别的了,每个 region属于哪个 table,每个table又一堆指标
配置hbase的conf目录下面的hadoop-metrics2-hbase.properties
*.source.filter.class=org.apache.hadoop.metrics2.filter.RegexFilter
#*.source.filter.class=org.apache.hadoop.metrics2.filter.GlobFilter
*.record.filter.class=${*.source.filter.class}
*.metric.filter.class=${*.source.filter.class}
*.period=10
*.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31
*.sink.ganglia.period=10
hbase.sink.ganglia.metric.filter.exclude=^(.*table.*)|(\w+metric)|(\w+region\w+)|(Balancer\w+)|(\w+Assign\w+)|(\w+percentile)|(\w+max)|(\w+median)|(\w+min)|(MetaHlog\w+)|(\w+WAL\w+)$
hbase.sink.ganglia.period=10
hbase.sink.ganglia.servers=IP:PORT
最后
以上就是阔达小蝴蝶为你收集整理的Ganglia收不到数据问题和页面显示异常问题详解的全部内容,希望文章能够帮你解决Ganglia收不到数据问题和页面显示异常问题详解所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复