多台服务器搭建的Rancher集群,之前一段时间都正常,能正常显示仪表盘,进入命名空间的工作负载显示当前安装的服务。

        今天web登录Rancher之后却报“当前集群Unavailable中...,在 API 准备就绪之前,直接与 API 交互的功能将不可用”问题。原本以为最近有压力测试影响性能,或者有暂时的网络问题过会就会自动好。结果过了半天时间还是没有好转,对应给各台Docker重启,或服务器重启都没能解决问题。

        进入etcd的主机服务器10.0.12.5,docker ps有发现rancher/rancher-agent:v2.5.11的容器一直未能启动成功,在一直Restarting。然后看到/var/log/containers/cattle-node-agent-XXX.log日志显示有:msg=\"Server certificate is not valid, please check if the host has the correct time configured and if the server certificate has a notAfter date and time in the future. Certificate information is displayed above. error: Get \\\"https://10.0.12.5:8443\\\": x509: certificate has expired or is not yet valid: current time 2024-10-23T08:37:17Z is after 2024-10-18T08:20:33Z\"\n","stream":"stdout","time":"2024-10-23T08:37:17.056705893Z"}的错误。

        该日志表示证书在10月18号过期了,导致Rancher服务更新rancher/rancher-agent:v2.5.11等服务异常,相应更新rancher主容器的证书之后,问题解决。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐