kubernetes ValidatingAdmissionPolicy:修复指标

kq0g1dla  于 6个月前  发布在  Kubernetes
关注(0)|答案(5)|浏览(71)

需要添加什么?

自1.3版本起,ValidatingAdmissionPolicy指标处于alpha稳定性阶段[1]。目前,这些指标存在以下问题:

  • 无法统计总错误数,当前实现仅计算"error but failurePolicy=Ignore",而不计算由错误引起的拒绝;
  • 无法区分错误,特别是 transient 错误(如"params not ready")和持久性错误(如运行时错误);
  • 当前实现未记录因错误导致的接受或拒绝的评估持续时间。这个问题使得对策略性能的任何分析都不可能。

为了解决上述问题,需要对指标进行以下增强:

  • check_totalcheck_duration_seconds中添加标签error;
  • 将值与每个可能的错误枚举,即RUNTIMEPARAMSINTERNAL。标签可以为空,表示没有错误;
  • ObserveRejection添加错误处理,以记录来自错误的任何拒绝;
  • 在所有调用ObserveRejection的地方添加错误报告;

参考资料:

  1. https://github.com/kubernetes/kubernetes/blob/v1.30.0-beta.0/staging/src/k8s.io/apiserver/pkg/admission/plugin/policy/validating/metrics/metrics.go

为什么需要这个?

解决上述提到的问题。
让我们在另一个问题中讨论指标的beta毕业。

相关问题