我们应该在无状态流处理的中间数据库中存储数据吗?

ezykj2lf  于 2021-06-07  发布在  Kafka
关注(0)|答案(0)|浏览(210)

关闭。这个问题需要更加突出重点。它目前不接受答案。
**想改进这个问题吗?**通过编辑这篇文章更新这个问题,使它只关注一个问题。

三年前关门了。
改进这个问题
我正在研究一个案例,其中包括为实时流处理问题提出一个技术架构。问题是一家运输公司想要近乎实时地跟踪其公交车的速度和乘客数量。我提出的最初架构如下:
总线将数据实时发送到mqqt服务器
apachekafka通过mqqt连接器从该服务器获取数据
使用kafka streams api或spark streaming计算“速度”和“乘客数量”
“速度”和“乘客数量”的可视化。
我的问题如下
建筑,对吗?
在这种情况下,流处理问题是无状态的吗?
最后,我想知道,在进行可视化之前,是否必须将数据存储在cassandra这样的中间数据库中?
如果没有,是否有一个开源的可视化工具可以直接与运动中的流交互?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题