Redpanda看起来很容易使用,但是如何实时处理流呢?我们有几千台物联网设备,每秒钟都会向我们发送数据。我们希望获得每台设备过去一小时的数据平均值。内置的WebAssembly功能可以用于此目的吗?或者我们需要像Materialize这样的东西吗?
mwkjh3gx1#
由于RedPanda被称为“Kafka Compatible”,任何Kafka库都应该与RedPanda一起工作,包括Kafka Streams、KSQL、Apache Spark、Flink、Storm等。
m528fe3b2#
以下是有关与Redpanda配合使用的流处理器的详细信息。https://redpanda.com/blog/kafka-stream-processors
wdebmtf23#
谢谢大家,既然没有人提到,我也会在这里加上我自己的答案。我们最终使用了Bytewax。它与我们现有的Kubernetes设置配合得很好。它支持有状态操作,并可根据需要水平扩展到多个pod。它的性能非常好(1),而且由于它基本上只是一个python程序,因此可以定制为读取和写入任何您想要的内容。(1)Bytewax pod实际上比KafkaJS pod使用更少的CPU,KafkaJS pod只将所有消息存储到DB中。
3条答案
按热度按时间mwkjh3gx1#
由于RedPanda被称为“Kafka Compatible”,任何Kafka库都应该与RedPanda一起工作,包括Kafka Streams、KSQL、Apache Spark、Flink、Storm等。
m528fe3b2#
以下是有关与Redpanda配合使用的流处理器的详细信息。https://redpanda.com/blog/kafka-stream-processors
wdebmtf23#
谢谢大家,既然没有人提到,我也会在这里加上我自己的答案。
我们最终使用了Bytewax。
它与我们现有的Kubernetes设置配合得很好。它支持有状态操作,并可根据需要水平扩展到多个pod。它的性能非常好(1),而且由于它基本上只是一个python程序,因此可以定制为读取和写入任何您想要的内容。
(1)Bytewax pod实际上比KafkaJS pod使用更少的CPU,KafkaJS pod只将所有消息存储到DB中。