资讯专栏INFORMATION COLUMN

Kublet PLEG不健康问题排障

苏丹 / 2779人阅读

摘要:环境管控的集群。现象某个频繁出现错误,频率在分钟就会出现一次。排查发现有一个一直处于状态,也就是说杀不死。用,强制删除。再到上检查这个容器是否真的被停止,,看到容器处于状态。观察状态,问题依旧。

环境:Rancher管控的K8S集群。

现象:某个Node频繁出现“PLEG is not healthy: pleg was last seen active 3m46.752815514s ago; threshold is 3m0s”错误,频率在5-10分钟就会出现一次。

排查:

kubectl get pods --all-namespaces 发现有一个istio-ingressgateway-6bbdd58f8c-nlgnd一直处于Terminating状态,也就是说杀不死。

到Node上docker logs --tail 100 kubelet也看到这个Pod的状态异常:

I0218 01:21:17.383650   10311 kubelet.go:1775] skipping pod synchronization - [PLEG is not healthy: pleg was last seen active 3m46.752815514s ago; threshold is 3m0s]
...
E0218 01:21:30.654433   10311 generic.go:271] PLEG: pod istio-ingressgateway-6bbdd58f8c-nlgnd/istio-system failed reinspection: rpc error: code = DeadlineExceeded desc = context deadline exceeded

kubelet delete pod尝试删除,命令挂住。

kubectl delete pod --force --grace-period=0,强制删除Pod。

再到Node上检查这个容器是否真的被停止,docker ps -a| grep ingressgateway-6bbdd58f8c-nlgnd,看到容器处于Exited状态。

观察Node状态,问题依旧。

把Pod关联的Deployment删除,把一只处于Terminating的Pod用kubectl delete pod --force --grace-period=0的方式删除。

重新部署Deployment。

问题解决。

相关issue

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/32886.html

相关文章

  • UK8S 集群常见问题 容器云 UK8S

    摘要:为什么在节点直接起容器网络不通为什么在节点直接起容器网络不通为什么在节点直接起容器网络不通使用自己的插件,而直接用起的容器并不能使用该插件,因此网络不通。 UK8S 集群常见问题本篇目录1. UK8S 完全兼容原生 Kubernetes API吗?2. UK8S 人工支持3. UK8S对Node上发布的容器有限制吗?如何修改?4. 为什么我的容器一起来就退出了?5. Docker 如何调整日...

    ernest.wang 评论0 收藏1762
  • 微服务简介

    摘要:微服务简介微服务架构是一种架构概念,旨在通过将功能分解到各个离散的服务中以实现对解决方案的解耦。每个微服务仅关注于完成一件任务并很好地完成该任务。服务异常自动隔离。微服务架构挑战服务规模大,部署运维管理难度大。 微服务简介 微服务架构(Microservice Architecture)是一种架构概念,旨在通过将功能分解到各个离散的服务中以实现对解决方案的解耦。 微服务是一种架构风格,...

    darcrand 评论0 收藏0
  • 【容器云 UK8S】常见问题排障指南:入门必读之Pod 常见命令,Controller 常见命令和

    摘要:入门必读提供了一系列的命令行工具来辅助我们调试和定位问题,本指南列举一些常见的命令来帮助应用管理者快速定位和解决问题。这里以为例,介绍的常用命令其他的命令类型与其一致。入门必读Kubernetes 提供了一系列的命令行工具来辅助我们调试和定位问题,本指南列举一些常见的命令来帮助应用管理者快速定位和解决问题。定位问题在开始处理问题之前,我们需要确认问题的类型,是 Pod ,Service ,或...

    Tecode 评论0 收藏0
  • 从零开始学习 Docker

    摘要:此命令下载测试镜像并在容器中运行它。国内很多云服务商都提供了加速器服务,例如阿里云加速器注册用户并且申请加速器,会获得如这样的地址。获取镜像阿里云镜像库上有大量的高质量的镜像可以用,这里我们就说一下怎么获取这些镜像并运行。 showImg(https://segmentfault.com/img/remote/1460000012924583); 这篇文章是我学习 Docker 的记录...

    lily_wang 评论0 收藏0
  • 容器打印日志到控制台阻塞的排障

    摘要:原文今日生产环境发现有些容器停止响应了,但是容器没有死,也能正常使用。在容器内部使用发现的一直处于运行状态但用没有发现有新的日志输出,且访问该应用肯定会输出日志的接口也是没有任何日志输出,因此怀疑阻塞住了。 原文 今日生产环境发现有些容器停止响应了,但是容器没有死,docker exec -it /bin/bash也能正常使用。 在容器内部使用jstack 发现log4j2的Cons...

    aaron 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<