工作失败时的Flink度量不是我在普罗米修斯身上所期望的

yftpprvb  于 2021-06-24  发布在  Flink
关注(0)|答案(0)|浏览(324)

我现在正试着用普罗米修斯监控Flink的流媒体工作。其中一个要求是在作业失败时发送警报。根据文档,度量flink\u jobmanager\u job\u downlight对于已完成的作业发出-1,因此我使用以下表达式创建了一个警报。

expr: flink_jobmanager_job_downtime{job_id=".*"} == -1

问题是,我检查了prometheuswebui和flink\ujobmanager\ujob\udownless的度量值,对于失败的作业,它从不发出-1。事实上,它只发出0,所以警报不会触发。是我遗漏了什么还是这真的是我期望的行为?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题