我们试验了一个可能由参数引起的问题 auto.leader.rebalance.enable
,在代理上默认设置为true。
具体来说,当自动重新平衡发生时,例如在代理重新启动之后,会移动一些分区引线以匹配首选引线。在这个事件之后,一些有状态的kafka流应用程序在源分区上阻塞,这些分区的领导者已经被移动,使用者延迟开始增长。
这是一个已知的问题吗?为什么申请者没有收到有关领导变动的信息?
如果我们需要执行代理的滚动重启,我们找到的战术解决方案是:
停止有状态应用程序
执行滚动重新启动。
等待5分钟(默认值),直到发生自动引线重新平衡
启动有状态的应用程序。
我们正在使用 Confluent Platform Community 5.2.2
,部署在prem群集上的3节点上。
我们正在尝试重新创建测试环境中发生的事情,但没有成功。它是否可能受集群负载的影响,在测试中要低得多?
提前谢谢!乔治
暂无答案!
目前还没有任何答案,快来回答吧!