由于未知的原因(通常每周在生产和测试中出现几次),我们无法与kafka代理通信,并且此消息在日志中重复:无法建立到节点nnnn的warn连接。代理可能不可用(org.apache.kafka.clients.networkclient)
奇怪的是,这反过来又阻碍了Kafka的工作(我们不能生产/消费)。
openshift没有意识到它不起作用,Kafka也没有意识到。
如果代理容器中的命令没有执行,我将向yaml添加一个livenessprobe来重新启动pod,但是我们希望自然地找到根本原因。
如果我用卷发url:hostport command 从另一个代理或zookeeper节点,您可以获得来自所有其他代理和zookeeper的回复。然而,curl到kafka节点,它“failed”返回“could not resolve host…”,即使我可以进入openshift并使用终端。我在日志中找不到任何其他错误。
我不知道这是Kafka还是openshift/kubernetes的问题。
如果其他人有这个问题并解决了它,我会很感激一些指点。
1条答案
按热度按时间r1zhe5dt1#
我在配置Kafka时遇到了这样一个错误。这是因为经纪人之间无法沟通。
下面是我的statefulset的一个片段(我使用kubernetes):
选择
--override zookeeper.connect=zookeeper-0.zookeeper:2181
非常重要,需要列出所有zookeeper节点。因为我为zookeeper定义了一个服务,并且只为zookeeper定义了一个statefolSet,所以在我编写的abod选项中
zookeeper-0.zookeeper
如果你有更多,把它们都列出来。我以前的职位是:
kafka+zookeeper:无法建立到节点-1的连接。代理可能不可用
kubernetes服务无法与kafka一起按预期工作
你可以从中找到有用的信息。我希望这有帮助。