我是靠谱客的博主 曾经小懒猪,这篇文章主要介绍业务报警维度记录,现在分享给大家,希望可以做个参考。

做项目肯定要针对核心项目做告警,及时发现。特此记录下项目告警的维度

告警来源

告警规则

建议配置

等级

是否配置

基础设施

CPU利用率

> 70% (多核百分比)

WARING

磁盘I/O

write byte > 50~100mb

WARING

JVM

MP

YGC/FGC 次数及时间

YGC time > 300~500ms

FGC 连续触发2次

CRITICAL

内存使用率

> 80%

WARING

应用

接口流量同比

-1d同比增长20%

WARING

核心接口p99

上游调用方超时时间的80% ,或同比7日两倍TP99线

CRITICAL

接口成功率

< 97%

CRITICAL

异常数量

要分出业务类告警和系统异常告警,后依量而定,运行时异常阈值配置不超过20

WARING

单机异常

要分出业务类告警和系统异常告警,后依量而定,运行时异常阈值配置不超过20

WARING

外部依赖(SOA/DB/Redis)

请求p99

核心流程接口 > 250ms

或同比增长10%

CRITICAL

连接/超时异常

> 10

CRITICAL

成功率

< 97%

CRITICAL

缓存命中率

< 95% (依靠流量比和穿透放大比调整)

WARING

MQ

消息堆积量

> 1K

WARING

消费速率

需要和消息生产速度比较

WARING

最后

以上就是曾经小懒猪最近收集整理的关于业务报警维度记录的全部内容,更多相关业务报警维度记录内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(36)

评论列表共有 0 条评论

立即
投稿
返回
顶部