kubernetes 为什么我的AWS EKS集群无法正常运行

vof42yt1  于 2023-05-16  发布在  Kubernetes
关注(0)|答案(1)|浏览(199)

我通过使用按需(5个示例)和spot示例(自动扩展27个所需示例)来设置我的AWS EKS集群。我配置了自动扩展pod,以确保在触发扩展时会创建节点。起初集群工作正常,但过了一段时间,运行pod状态的spot示例变为挂起,集群无故缩减(例如缩减至15个节点)。然后我的服务无法访问。在AWS的日志中,我看到Spot节点组被降级,错误是“无法启动Spot示例。UnfulfillableCapacity -由于您的请求配置而无法满足容量。请调整您的请求并重试。启动EC2示例失败。”一段时间后,它正常工作,Pod扩展,但40分钟无法访问服务。我不认为这会发生,如果我使用所有的按需示例,但什么是导致这个错误与现货示例,有人可以解释吗?如果需要,我可以给予更多信息。

wkyowqbh

wkyowqbh1#

Spot示例是可中断的;当其他地方需要这种能力时,它们可以被回收。如果您的工作负载不能容忍中断,则不应使用Spot,或者应在按需示例上运行至少1个副本。避免容量不足错误的最简单方法是在ASG和/或Karpenter供应器中 * 多样化示例类型 *。请查看https://aws.github.io/aws-eks-best-practices/cluster-autoscaling/https://aws.github.io/aws-eks-best-practices/karpenter/以了解更多信息。

相关问题