背景
我继承了Kafka/zookeeper的装置。我对这些都略知一二——我知道一般的体系结构、客户机的工作方式、关于主题等,也参与过java客户机的编程等。
但安装有点可疑。它们分别是Kafka和zookeeper的三个示例(在各自的docker容器中)。按理说,它们应该可以工作,但我看到的是,所有进程都会输出大量的日志,其中包含大量(不同的)警告和错误。我有一个印象,其中一些似乎是相当正常的(或正在自我愈合的所有时间),我有一个非常困难的时间,如果一切工作的预期或不,并设置正确。
据谷歌(google)称,其中一些与券商不干净的停业有关;个人主题等等。由于这是一个测试环境,我可以很容易地删除这样的文件。
我知道一些命令可以帮助我检查主题等(基本的东西,比如列出它们,显示它们各自的配置等)。
然而。。。
问题
是否有可用作系统演练的在线资源/文档,以检查是否所有设置基本正常;例如,要澄清这些问题:
三个zookeepers和三个kafka示例是否为了高可用性而正确地相互通信?他们有正确的“领导”吗。?
服务器是否通常“健康”,即易于接受连接等。?
主题是如何工作的(里面有什么,有多少条消息等)?
我知道人们很快就会认为这个问题过于笼统;我不是要你解决我的问题。我正在寻找一个ressource来系统地浏览这样一个安装-它可能包括,也可能不包括我给出的例子,但它肯定应该给出一个系统的方法来找出事情是否根本错误。
2条答案
按热度按时间g52tjvyc1#
本packtpub指南/st培训é在集群模式下设置Kafka时,phane maarek是一个很好的资源。然而,他在ubuntuvm的aws云中做到了这一点。
我也遵循同样的步骤,在cent操作系统中安装了vagrant vms。你可以在这里找到代码。
虚拟机有雅虎Kafka管理器来监控Kafka的内部细节。可用的代理、健康的、分区、引线等的列表。,
kafka manager可以帮助您进行高级监控。
请提供您的意见。
yks3o0rb2#
与其只看日志,不如熟悉jmx指标以及如何在集群中收集它们。
如果您真的想收集和分析日志,您可能需要单独使用elasticsearch之类的工具。
你不会在一个主题中看到“有多少条消息”,你需要更多的监视来知道一个端口是否真的打开了,kafka进程是否正在运行,磁盘是否已满等等。
我的观点是,Kafka需要食物和水,如果你计划将其生产化,你不能只是建立一个小集群而忘记它。即使一开始你认为它的设置是正确的,增加它的负载最终也会使它陷入糟糕的状态。
为了对开发环境进行有限的测试以全面了解集群的运行状况,confluent control center可以提供帮助。
为了解决“里面有什么”的问题,我建议您设置一个模式注册表,并说服kafka生产者使用它。