kubernetes 所有GKE群集节点都已重新启动,如何知道重新启动的原因?

utugiqy6  于 2022-12-17  发布在  Kubernetes
关注(0)|答案(2)|浏览(159)

我有一个版本为“www.example.com”的GCP GKE集群1.22.12-gke.300。大约有20个节点分布在4个节点池中。该集群是在一个月前创建的,也是我注意到所有节点都重新启动的最后一天。当我使用命令kubectl get nodes查看节点的详细信息时,我看到了以下结果(如下)。所有节点的年龄为16或17小时。

gke-company-name-gke-clust-company-name-default-n-97c8e50a-d63m   Ready    <none>   17h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-default-n-97c8e50a-l8zw   Ready    <none>   17h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-demo-app--d251216f-2uou   Ready    <none>   16h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-demo-app--d251216f-3mj1   Ready    <none>   16h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-demo-app--d251216f-doml   Ready    <none>   16h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-app--5ae07853-7mwd   Ready    <none>   17h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-app--5ae07853-gzxy   Ready    <none>   17h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-app--5ae07853-lgvo   Ready    <none>   17h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-nifi-fd3e5533-27gf   Ready    <none>   16h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-nifi-fd3e5533-7r4q   Ready    <none>   16h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-nifi-fd3e5533-e680   Ready    <none>   16h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-nifi-fd3e5533-m2vf   Ready    <none>   17h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-nifi-fd3e5533-mtvg   Ready    <none>   17h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-nifi-fd3e5533-mwiy   Ready    <none>   16h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-nifi-fd3e5533-rwf9   Ready    <none>   16h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-nifi-fd3e5533-tqe0   Ready    <none>   17h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-nifi-fd3e5533-weai   Ready    <none>   17h     v1.22.12-gke.300
gke-company-name-gke-clust-company-name-prod-nifi-fd3e5533-xmss   Ready    <none>   16h     v1.22.12-gke.300

是否有任何方法可以确定此重新启动/重新启动背后的原因。因为此意外重新启动导致我的系统出现一些问题。我只是想确定这些重新启动的原因,以便我可以知道这些类型的重新启动预计在未来。
任何帮助都很感激。

r8uurelv

r8uurelv1#

在/var/log/messages文件中查找日志条目,您会发现一些提示

gwbalxhn

gwbalxhn2#

我从上面的评论中得到了关于这个link的问题的答案,我只想解释一下这个场景,让其他人受益。
我在GKE上创建了一个集群,发布通道为“常规”。因为选择了这个通道,所以每当发布新的安全或补丁更新时,GKE都会自动升级集群和节点。
您可以使用以下命令查找升级状态

gcloud container operations list --filter="TYPE:UPGRADE_MASTER"

相关问题