我是靠谱客的博主 多情星星,最近开发中收集的这篇文章主要介绍k8s pod内部ping不通service项目场景:问题描述原因分析:解决方案:,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

项目场景:

提示:又是连续2天的加班,麻了,给兄弟们做个网上找不到的问题解决方案吧:

场景:因生产出现故障,重新启动apollo几个组件pod后,访问不了apollo web界面。


问题描述

提示:项目中遇到的问题:

很奇怪,平时没有apollo出问题的事。由于apollo错误日志太多了,整的人头痛,最后还是确定了这条日志是关键所在:

Caused by: java.net.UnknownHostException: apollo-config-server-service.default

原因分析:

补充次要知识点:很多兄弟看到k8s这个点default不明白什么意思,实际上default代表命名空间的意思。举个例子:order命名空间的A服务要调用 gateway命名空间的B(service)服务的接口的话,就得在deployment里这样配置:http://B.gateway

主要问题分析:

  1. 很明显上面的意思是域名解析出问题了,于是我进到pod里去ping 这个service试试
# ping  apollo-config-server-service
# 卡住了
  1. 从上面可以看出pod内部ping不通k8s的svc,那只有两种可能:
第一,dns解析就出问题了,这个因为之前解决过,现在不可能出现这个问题(具体怎么解决的,我在后面文章给大家分析解决一下)
第二, dns解析没问题,沿着A服务-->coredns --> 解析出svc ip--->kube-proxy将svc的请求转发到后端pod ip这样的链路我们确定 问题出现在 coredns和kube-proxy这里了

3.我开始排查coredns,立马重启。这里有插曲,奇怪的是我这个coredns只在一个节点上能起来,没办法就让他在那个节点待着吧

4.在回到pod ping发现,还是不通

5.重启kube-proxy后,ping通了


解决方案:

提示:当你发现环境突然网络访问不了svc的时候,请直接重启所有的kube-proxy:
1.确认内核版本在4.1以上
2.重启kube-proxy
参考文章

最后

以上就是多情星星为你收集整理的k8s pod内部ping不通service项目场景:问题描述原因分析:解决方案:的全部内容,希望文章能够帮你解决k8s pod内部ping不通service项目场景:问题描述原因分析:解决方案:所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(46)

评论列表共有 0 条评论

立即
投稿
返回
顶部