kubernetes TaintBaseEviction应该具有默认的优雅超时时间,

ycggw6v2  于 4个月前  发布在  Kubernetes
关注(0)|答案(3)|浏览(51)

需要添加什么?

从1.20版本开始,TaintBasedEvictions功能GA在PR #87487中默认启用了TaintBasedEviction;
当节点处于NotReady或Unreachable状态时,NodeLifecycle controller会在节点上添加NoSchedule和NoExecute污点,然后污点管理器会立即驱逐pod,因为有NoExecute污点;APIServer可以通过Admission Controllers为pod设置容忍时间,详见:https://kubernetes.io/docs/reference/access-authn-authz/admission-controllers/#defaulttolerationseconds。
但问题是,APIServer中的DefaultTolerationSeconds仅影响新创建的pod,这意味着如果我想要更新驱逐时间,我需要重建pod;
我认为我们需要为NodeLifecycle controller添加两个参数,分别是default-unreachable-toleration-secondsdefault-not-ready-toleration-seconds,当pod没有设置节点不可达和NotReady容忍度时,KCM中的TaintManager应该将它们作为默认值使用。

为什么需要这个?

default-unreachable-toleration-secondsdefault-not-ready-toleration-seconds可以在不重新创建pod的情况下工作。

pxyaymoc

pxyaymoc1#

这个问题目前正在等待分类。
如果SIG或子项目确定这是一个相关的问题,他们将通过应用triage/accepted标签并提供进一步的指导来接受它。
组织成员可以通过在评论中写入/triage accepted来添加triage/accepted标签。
有关使用PR评论与我互动的说明,请查看here。如果您对我的行为有任何问题或建议,请针对kubernetes/test-infra仓库提出一个问题。

oalqel3c

oalqel3c3#

Kubernetes项目目前缺乏足够的贡献者来充分应对所有问题。
此机器人根据以下规则对未分类的问题进行分级处理:

  • lifecycle/stale应用后的90天不活动后,将应用lifecycle/stale
  • lifecycle/stale应用后的30天不活动后,将应用lifecycle/rotten
  • lifecycle/rotten应用后的30天不活动后,该问题将被关闭

您可以:

  • 将此问题标记为新鲜的/remove-lifecycle stale
  • 使用/close关闭此问题
  • 提供帮助,请使用Issue Triage

请将反馈发送至sig-contributor-experience@kubernetes/community
/lifecycle stale

相关问题