我现在正试着用普罗米修斯监控Flink的流媒体工作。其中一个要求是在作业失败时发送警报。根据文档,度量flink\u jobmanager\u job\u downlight对于已完成的作业发出-1,因此我使用以下表达式创建了一个警报。
expr: flink_jobmanager_job_downtime{job_id=".*"} == -1
问题是,我检查了prometheuswebui和flink\ujobmanager\ujob\udownless的度量值,对于失败的作业,它从不发出-1。事实上,它只发出0,所以警报不会触发。是我遗漏了什么还是这真的是我期望的行为?
暂无答案!
目前还没有任何答案,快来回答吧!