需要添加什么?
自1.3版本起,ValidatingAdmissionPolicy指标处于alpha稳定性阶段[1]。目前,这些指标存在以下问题:
- 无法统计总错误数,当前实现仅计算"error but failurePolicy=Ignore",而不计算由错误引起的拒绝;
- 无法区分错误,特别是 transient 错误(如"params not ready")和持久性错误(如运行时错误);
- 当前实现未记录因错误导致的接受或拒绝的评估持续时间。这个问题使得对策略性能的任何分析都不可能。
为了解决上述问题,需要对指标进行以下增强:
- 在
check_total
和check_duration_seconds
中添加标签error
; - 将值与每个可能的错误枚举,即
RUNTIME
、PARAMS
、INTERNAL
。标签可以为空,表示没有错误; - 为
ObserveRejection
添加错误处理,以记录来自错误的任何拒绝; - 在所有调用
ObserveRejection
的地方添加错误报告;
参考资料:
为什么需要这个?
解决上述提到的问题。
让我们在另一个问题中讨论指标的beta毕业。
5条答案
按热度按时间mzmfm0qo1#
laximzn52#
/sig instrumentation
a6b3iqyw3#
/triage accepted
ss2ws0br4#
cc @logicalhan
iq0todco5#
cc @fedebongio