已关闭,此问题需要details or clarity。它目前不接受回答。
**想改善这个问题吗?**通过editing this post添加详细信息并澄清问题。
关闭7天前。
Improve this question
Apache Kafka:分布式消息传递系统
Apache Spark:实时数据处理
如何在实时数据管道中使用这两种技术进行数据处理?
在实时数据流方面,对我来说,他们都做了这项工作。我们如何使用上述两种技术来分析社交受众数据?
已关闭,此问题需要details or clarity。它目前不接受回答。
**想改善这个问题吗?**通过editing this post添加详细信息并澄清问题。
关闭7天前。
Improve this question
Apache Kafka:分布式消息传递系统
Apache Spark:实时数据处理
如何在实时数据管道中使用这两种技术进行数据处理?
在实时数据流方面,对我来说,他们都做了这项工作。我们如何使用上述两种技术来分析社交受众数据?
1条答案
按热度按时间nukf8bse1#
两个都做什么工作?Kafka是服务器。Spark是客户。它们不一样,可以一起使用。Spark也可以单独使用,例如与Socket Streaming源代码或RabbitMQ一起使用。
文档准确地解释了Kafka集成所需的内容。https://spark.apache.org/docs/latest/structured-streaming-kafka-integration.html
请注意,虽然有些人说ApacheFlink确实更适合流工作流,但Spark实际上是“微批处理”。