故障排查:k8s集群中的Etcd启动失败(Failed to bring up Etcd Plane)
本文记录了k8s集群的一次故障和其解决办法。
博客主页:https://tomcat.blog.csdn.net
博主昵称:农民工老王
主要领域:Java、Linux、K8S
期待大家的关注💖点赞👍收藏⭐留言💬
故障详情
最近在维护k8s时,遇到报错,提示ETCD启动失败。
[etcd] Failed to bring up Etcd Plane: Failed to create [etcd-fix-perm] container on host [192.168.130.155]: Failed to create Docker container [etcd-fix-perm] on host [192.168.130.155]: Error response from daemon: Conflict. The container name “/etcd-fix-perm” is already in use by container “0d8a6ab47e4dfb971d6d700387837eaba0b58f0088a155897e02fad3d2deef09”. You have to remove (or rename) that container to be able to reuse that name.
查看docker容器状态,发现有部分容器异常。
解决办法
依次运行以下命令,可以解决问题。
# 清理docker的垃圾
docker system prune
# 重启docker
systemctl restart docker
回顾总结
造成这个故障大概率是因为集群节点的关机操作过于粗暴造成,如果遇到突然断电,或者直接init 0,则重启节点计算机后,可能遭遇这个情况。在维护k8s集群时,如遇到需要关机的情况,最好是先停掉所有容器,然后再关机。
如果是其他原因造成了Etcd启动失败,那么本文中的方法就不再适用。
如需转载,请注明本文的出处:农民工老王的CSDN博客https://blog.csdn.net/monarch91 。
更多推荐
所有评论(0)