我正在寻找kafka代理的jmx度量值[如果可能的话,不要超过1或2],它在高级别上可以标识集群的健康状况?我参考了datadog和confluent编制的列表,但没有找到任何类似的。
zwghvu4y1#
我认为集群健康状况的一些指标如下:离线/复制分区不足:这是一个很好的指示器,可以指示集群中的所有节点是否都在线。如果其中一个离线,您几乎肯定会看到一些正在复制中,如果有几个离线,您甚至可能会看到一些离线分区。主动控制器:如果这一点不断变化,则意味着集群可能不稳定。控制器不应定期更换;如果是这样,那么你的集群就出了问题。字节输入/输出:这表明集群能够发送和接收数据。如果这些值低于预期值,则可能意味着集群正在经历某种网络问题,这可能会影响集群的运行状况。希望这有帮助!
1条答案
按热度按时间zwghvu4y1#
我认为集群健康状况的一些指标如下:
离线/复制分区不足:这是一个很好的指示器,可以指示集群中的所有节点是否都在线。如果其中一个离线,您几乎肯定会看到一些正在复制中,如果有几个离线,您甚至可能会看到一些离线分区。
主动控制器:如果这一点不断变化,则意味着集群可能不稳定。控制器不应定期更换;如果是这样,那么你的集群就出了问题。
字节输入/输出:这表明集群能够发送和接收数据。如果这些值低于预期值,则可能意味着集群正在经历某种网络问题,这可能会影响集群的运行状况。
希望这有帮助!