我已经在集群上设置了Prometheus,其中包含几条警报规则,如下所示:
- alert: ContextSwitching
expr: rate(node_context_switches_total[5m]) > 1000
for: 30m
labels:
severity: warning
有人能解释一下这条规则的目的吗?
另外,在我的例子中,rate(node_context_switches_total[5m])
总是大于2000。这是我应该担心的吗?
我已经在集群上设置了Prometheus,其中包含几条警报规则,如下所示:
- alert: ContextSwitching
expr: rate(node_context_switches_total[5m]) > 1000
for: 30m
labels:
severity: warning
有人能解释一下这条规则的目的吗?
另外,在我的例子中,rate(node_context_switches_total[5m])
总是大于2000。这是我应该担心的吗?
1条答案
按热度按时间8i9zcol21#
上下文切换是存储进程或线程状态的操作。根据Prometheus Documentation book和metrics description-
node_context_switches_total
是上下文切换的总数。典型警报如下所示: