spark structured streaming/kafka中可能存在小内存泄漏

fivyi3re 于 2021-05-19 发布在 Spark

关注(0)|答案(0)|浏览(480)

我们有一个基于spark structured streaming 2.4.6的应用程序，读取Kafka主题，根据用户配置（高度灵活和可定制）进行一些计算或聚合，并写入Kafka和kairosdb。它在k8s上运行。
现在，在我们的测试中，配置驱动大约140个流式查询，有3个执行器，每个执行器都有3g内存和3g内存开销，它每5分钟处理大约77kb的传入数据（一个小摄取率测试）。但遗嘱执行人将在8小时内被杀。下面是驱动程序的错误日志：
TaskSchedulerImpl: Lost executor 3 on 192.168.36.255: Executor heartbeat timed out after 122093 ms TaskSchedulerImpl: Lost executor 3 on 192.168.36.255: The executor with id 3 was deleted by a user or the framework. 执行者的最后日志如下： TaskMemoryManager: Failed to allocate a page (33554432 bytes), try again. 然后，我密切监视着记忆。我观察到自由堆图表中的自由堆有明显的下降趋势（最后下降到只有200m），而kafka common和client包中的一些对象的计数（对象计数图表）有上升趋势。在最后的堆转储中，除了jdk对象之外，剩下的大多数对象都来自kafka common和client包。样本为： org.apache.kafka.common.MetricName org.apache.kafka.common.metrics.KafkaMetric org.apache.kafka.common.metrics.Sensor org.apache.kafka.common.metrics.stats.SampledStat$Sample org.apache.kafka.clients.ApiVersion 在我看来，spark structured streaming/kafka中有一个小内存泄漏。是sss的错误还是Kafka的错误？以前有没有人遇到过类似的问题？有人能就如何解决这个问题提出一些建议吗？

scala apache-kafka apache-spark spark-structured-streaming kubernetes

来源：https://stackoverflow.com/questions/64383996/possible-small-memory-leak-in-spark-structured-streaming-kafka

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

spark structured streaming/kafka中可能存在小内存泄漏

暂无答案！

相关问题

热门标签

最新问答