Kafka 如何用Redpanda进行流处理?

cyvaqqii  于 2023-01-16  发布在  Apache
关注(0)|答案(3)|浏览(116)

Redpanda看起来很容易使用,但是如何实时处理流呢?
我们有几千台物联网设备,每秒钟都会向我们发送数据。我们希望获得每台设备过去一小时的数据平均值。内置的WebAssembly功能可以用于此目的吗?或者我们需要像Materialize这样的东西吗?

mwkjh3gx

mwkjh3gx1#

由于RedPanda被称为“Kafka Compatible”,任何Kafka库都应该与RedPanda一起工作,包括Kafka Streams、KSQL、Apache Spark、Flink、Storm等。

m528fe3b

m528fe3b2#

以下是有关与Redpanda配合使用的流处理器的详细信息。https://redpanda.com/blog/kafka-stream-processors

wdebmtf2

wdebmtf23#

谢谢大家,既然没有人提到,我也会在这里加上我自己的答案。
我们最终使用了Bytewax
它与我们现有的Kubernetes设置配合得很好。它支持有状态操作,并可根据需要水平扩展到多个pod。它的性能非常好(1),而且由于它基本上只是一个python程序,因此可以定制为读取和写入任何您想要的内容。
(1)Bytewax pod实际上比KafkaJS pod使用更少的CPU,KafkaJS pod只将所有消息存储到DB中。

相关问题