概述
做项目肯定要针对核心项目做告警,及时发现。特此记录下项目告警的维度
告警来源 | 告警规则 | 建议配置 | 等级 | 是否配置 | |
基础设施 | CPU利用率 | > 70% (多核百分比) | WARING |
| |
磁盘I/O | write byte > 50~100mb | WARING |
| ||
JVM | MP | YGC/FGC 次数及时间 | YGC time > 300~500ms FGC 连续触发2次 | CRITICAL |
|
内存使用率 | > 80% | WARING |
| ||
应用 | 接口流量同比 | -1d同比增长20% | WARING |
| |
核心接口p99 | 上游调用方超时时间的80% ,或同比7日两倍TP99线 | CRITICAL |
| ||
接口成功率 | < 97% | CRITICAL |
| ||
异常数量 | 要分出业务类告警和系统异常告警,后依量而定,运行时异常阈值配置不超过20 | WARING |
| ||
单机异常 | 要分出业务类告警和系统异常告警,后依量而定,运行时异常阈值配置不超过20 | WARING |
| ||
外部依赖(SOA/DB/Redis) | 请求p99 | 核心流程接口 > 250ms 或同比增长10% | CRITICAL |
| |
连接/超时异常 | > 10 | CRITICAL |
| ||
成功率 | < 97% | CRITICAL |
| ||
缓存命中率 | < 95% (依靠流量比和穿透放大比调整) | WARING |
| ||
MQ | 消息堆积量 | > 1K | WARING |
| |
消费速率 | 需要和消息生产速度比较 | WARING |
|
最后
以上就是曾经小懒猪为你收集整理的业务报警维度记录的全部内容,希望文章能够帮你解决业务报警维度记录所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复