目录
-
- 需求
- 现有方案
- 进展
- 实现
- 验证
需求
查看K8S集群被探针检测重启的pod什么时间段,因为什么重启了,把所有的pod状态持久化到ES服务。
现有方案
如果环境中只有一种探针方式(HTTP),可以通过Prometheus+grafana来监控pod的可用状态数量,来达到pod什么时间被重启了,原因当然就HTTP方式检测状态码失败导致的。
如果环境中存在多种探针方式(HTTPS、HTTP、TCP),再加上kubernetes目前events事件保留一个小时,超时后就查不到events事件了,我们可以把events做到持久化数据,进阶需求可以做一个企业微信通知????。
进展
1、把所有pod状态事件发送到ES服务(完成)
2、做企业微信通知(待完成)
实现
如果查看一个小时内的所有类型资源的状态可以使用events
查看
kubectl get events -n ddi |tail -n 10
最后
以上就是漂亮小熊猫最近收集整理的关于【DevOps】kubernetes 健康检查,POD状态事件events日志数据持久化(ES+Kibana)的全部内容,更多相关【DevOps】kubernetes内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复