我是靠谱客的博主 曾经小懒猪,最近开发中收集的这篇文章主要介绍业务报警维度记录,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

做项目肯定要针对核心项目做告警,及时发现。特此记录下项目告警的维度

告警来源

告警规则

建议配置

等级

是否配置

基础设施

CPU利用率

> 70% (多核百分比)

WARING

磁盘I/O

write byte > 50~100mb

WARING

JVM

MP

YGC/FGC 次数及时间

YGC time > 300~500ms

FGC 连续触发2次

CRITICAL

内存使用率

> 80%

WARING

应用

接口流量同比

-1d同比增长20%

WARING

核心接口p99

上游调用方超时时间的80% ,或同比7日两倍TP99线

CRITICAL

接口成功率

< 97%

CRITICAL

异常数量

要分出业务类告警和系统异常告警,后依量而定,运行时异常阈值配置不超过20

WARING

单机异常

要分出业务类告警和系统异常告警,后依量而定,运行时异常阈值配置不超过20

WARING

外部依赖(SOA/DB/Redis)

请求p99

核心流程接口 > 250ms

或同比增长10%

CRITICAL

连接/超时异常

> 10

CRITICAL

成功率

< 97%

CRITICAL

缓存命中率

< 95% (依靠流量比和穿透放大比调整)

WARING

MQ

消息堆积量

> 1K

WARING

消费速率

需要和消息生产速度比较

WARING

最后

以上就是曾经小懒猪为你收集整理的业务报警维度记录的全部内容,希望文章能够帮你解决业务报警维度记录所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(47)

评论列表共有 0 条评论

立即
投稿
返回
顶部