我正在尝试创建一个samza作业,尽可能类似于wikipedia示例作业。但是,在“wikipediafeed”对象中,我尝试从不同的kafka代理获取数据,而不是在启动hello samza网格时运行的kafka代理。
我是否必须在“wikipediafeed”对象中创建一个线程安全的kafka使用者来使用来自不同kafka集群的数据,还是有其他我看不到的方法?
编辑1:这里有一个链接到他们的维基百科例子。https://github.com/apache/samza-hello-samza/tree/master/src/main
谢谢
1条答案
按热度按时间a9wyjsp71#
在您的示例中,您需要更改此配置(https://github.com/apache/samza-hello-samza/blob/master/src/main/config/wikipedia-feed.properties) :
用前面的kafka集群更改配置,并在task.inputs中添加主题,以“,”分隔
编辑:为了清楚起见,您可以将samza部署到集群1中,并使用另一个集群中的kafka主题。您需要更改samza属性中的配置。
查看更多信息:samza config
然后,如果需要在处理之后将消息发送到另一个kafka集群,则需要在配置中创建另一个系统。
查看更多信息:https://samza.apache.org/learn/documentation/0.13/api/overview.html