我是靠谱客的博主 坚强帽子,最近开发中收集的这篇文章主要介绍分布式监控 Frostmourne,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

Frostmourne是开源分布式监控系统,用于帮助监控几乎所有数据库数据(包括Elasticsearch, Prometheus, SkyWalking, MySql 等)。如果你已经建立起了日志系统和指标体系,却苦恼于没有一个监控系统,也许它能帮到你。除了日志监控,Frostmourne还可以用于运维监控,业务监控等多维度的监控,规则语法强大使得自定义性和使用场景非常丰富。

日志监控介绍

通常我们都搭建ELK来搜集日志,然后对应用的日志进行埋点监控,此时需要一个灵活的可视化监控管理平台,下图是Frostmourne 的日志监控方案和支持的报警渠道。

日志监控示意图

Frostmourne最大优点在于开箱即用,支持监控任务和数据源分开管理,嵌套使用。报警内容支持textmarkdown两种格式,并可以配置消息的模版。以下是Frostmourne功能截图
dashboard

添加监控任务

报警截图

运维监控介绍

Frostmourne支持配置Prometheus为数据源,通过Promsql来获取数据,然后通过Javascript表达式来判断是否告警,例如查询语句

access_evaluation_duration_count{job="grafana"} == 0

Prometheus查询语句

点击预览数据可以获得如图json格式的数据,再配置Javascript表达式来进行报警判断
预览数据图
配置Javascript表达式

运维的维度上除了支持Prometheus外,还支持ping方式,且数据源支持万能的http请求形式,只要返回结果是json格式参数则便可以进行表达式规则判断以达到监控目的。另外运维最大的痛点是告警轰炸,举个例子,当某个节点宕机时,由于任务执行的相对频繁,告警消息会持续到达,如果关闭报警又担心错过别的报警。为解决该问题,Frostmourne支持逻辑运算符表达式智能判断是否静默,避免被消息轰炸。

智能判断是否静默

业务监控

在灵活的数据获取和强大的规则判断下,可以用Frostmourne创造丰富的监控场景。业务场景下,可以对特定场景下进行日志埋点,以达到业务报警,比如某件商品库存低于某个值时进行报警。丰富的数据源情况下,可以直接对业务数据进行监控,例如可以直接通过sql读取mysql数据库,通过库里的实时或历史数据进行同比或环比来监控业务数据量是否正常,或者对每日数据统计自动进行消息播报等等。例如对支付业务进行监控:
支付完成率监控

最后

更多使用介绍和安装方法可参考 github 或 gitee链接,文档相当详细,不妨一阅。

最后

以上就是坚强帽子为你收集整理的分布式监控 Frostmourne的全部内容,希望文章能够帮你解决分布式监控 Frostmourne所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(39)

评论列表共有 0 条评论

立即
投稿
返回
顶部