Frostmourne是开源分布式监控系统,用于帮助监控几乎所有数据库数据(包括Elasticsearch, Prometheus, SkyWalking, MySql 等)。如果你已经建立起了日志系统和指标体系,却苦恼于没有一个监控系统,也许它能帮到你。除了日志监控,Frostmourne还可以用于运维监控,业务监控等多维度的监控,规则语法强大使得自定义性和使用场景非常丰富。
日志监控介绍
通常我们都搭建ELK来搜集日志,然后对应用的日志进行埋点监控,此时需要一个灵活的可视化监控管理平台,下图是Frostmourne 的日志监控方案和支持的报警渠道。

Frostmourne最大优点在于开箱即用,支持监控任务和数据源分开管理,嵌套使用。报警内容支持text和markdown两种格式,并可以配置消息的模版。以下是Frostmourne功能截图



运维监控介绍
Frostmourne支持配置Prometheus为数据源,通过Promsql来获取数据,然后通过Javascript表达式来判断是否告警,例如查询语句
access_evaluation_duration_count{job="grafana"} == 0

点击预览数据可以获得如图json格式的数据,再配置Javascript表达式来进行报警判断


运维的维度上除了支持Prometheus外,还支持ping方式,且数据源支持万能的http请求形式,只要返回结果是json格式参数则便可以进行表达式规则判断以达到监控目的。另外运维最大的痛点是告警轰炸,举个例子,当某个节点宕机时,由于任务执行的相对频繁,告警消息会持续到达,如果关闭报警又担心错过别的报警。为解决该问题,Frostmourne支持逻辑运算符表达式智能判断是否静默,避免被消息轰炸。

业务监控
在灵活的数据获取和强大的规则判断下,可以用Frostmourne创造丰富的监控场景。业务场景下,可以对特定场景下进行日志埋点,以达到业务报警,比如某件商品库存低于某个值时进行报警。丰富的数据源情况下,可以直接对业务数据进行监控,例如可以直接通过sql读取mysql数据库,通过库里的实时或历史数据进行同比或环比来监控业务数据量是否正常,或者对每日数据统计自动进行消息播报等等。例如对支付业务进行监控:

最后
更多使用介绍和安装方法可参考 github 或 gitee链接,文档相当详细,不妨一阅。
最后
以上就是坚强帽子最近收集整理的关于分布式监控 Frostmourne的全部内容,更多相关分布式监控内容请搜索靠谱客的其他文章。
发表评论 取消回复