需要添加什么?
从1.20版本开始,TaintBasedEvictions
功能GA在PR #87487中默认启用了TaintBasedEviction;
当节点处于NotReady或Unreachable状态时,NodeLifecycle controller会在节点上添加NoSchedule和NoExecute污点,然后污点管理器会立即驱逐pod,因为有NoExecute污点;APIServer可以通过Admission Controllers为pod设置容忍时间,详见:https://kubernetes.io/docs/reference/access-authn-authz/admission-controllers/#defaulttolerationseconds。
但问题是,APIServer中的DefaultTolerationSeconds仅影响新创建的pod,这意味着如果我想要更新驱逐时间,我需要重建pod;
我认为我们需要为NodeLifecycle controller添加两个参数,分别是default-unreachable-toleration-seconds
和default-not-ready-toleration-seconds
,当pod没有设置节点不可达和NotReady容忍度时,KCM中的TaintManager应该将它们作为默认值使用。
为什么需要这个?
default-unreachable-toleration-seconds
和default-not-ready-toleration-seconds
可以在不重新创建pod的情况下工作。
3条答案
按热度按时间pxyaymoc1#
这个问题目前正在等待分类。
如果SIG或子项目确定这是一个相关的问题,他们将通过应用
triage/accepted
标签并提供进一步的指导来接受它。组织成员可以通过在评论中写入
/triage accepted
来添加triage/accepted
标签。有关使用PR评论与我互动的说明,请查看here。如果您对我的行为有任何问题或建议,请针对kubernetes/test-infra仓库提出一个问题。
9gm1akwq2#
/sig node
oalqel3c3#
Kubernetes项目目前缺乏足够的贡献者来充分应对所有问题。
此机器人根据以下规则对未分类的问题进行分级处理:
lifecycle/stale
应用后的90天不活动后,将应用lifecycle/stale
lifecycle/stale
应用后的30天不活动后,将应用lifecycle/rotten
lifecycle/rotten
应用后的30天不活动后,该问题将被关闭您可以:
/remove-lifecycle stale
/close
关闭此问题请将反馈发送至sig-contributor-experience@kubernetes/community。
/lifecycle stale