kafka流式提交kgroupedtable的最新消息

nkoocmlb 于 2021-06-07 发布在 Kafka

关注(0)|答案(1)|浏览(311)

我有Kafka流应用程序如下：

static KafkaStreams build(AppConfig appConfig, SerdesHelper serdes) {
  final KStreamBuilder builder = new KStreamBuilder();

  builder
      .table(serdes.sourceKeySerde, serdes.sourceValueSerde, appConfig.sourceTopic)
      .groupBy(StreamBuilder::groupByMapper, serdes.intSerde, serdes.longSerde)
      .aggregate(
          StreamBuilder::initialize,
          StreamBuilder::add,
          StreamBuilder::subtract,
          serdes.sinkValueSerde)
      .to(serdes.intSerde, serdes.sinkValueSerde, appConfig.sinkTopic);

  return new KafkaStreams(builder, appConfig.streamConfig);
}

我的具体例子如下

((k, v)) -> ((k), v[])

在使用只有两个唯一键的3.000.000条消息的虚拟数据运行时，我在 sinkTopic 在不到一分钟，我希望得到4/6（根据当时我设法停止应用程序）。
如何确保只有具有最新分组值的密钥才会提交回kafka，而不是每个中间消息？

Java apache-kafka apache-kafka-streams

来源：https://stackoverflow.com/questions/48384748/kafka-streams-committing-just-the-latest-message-of-kgroupedtable

1条答案

按热度按时间

这是流处理，而不是批处理。没有“最新分组值”——输入是无限的，因此输出是无限的。。。
你只能减少中间产物的数量
增加ktable缓存大小（但这对于您的情况来说似乎不是问题，因为您只有2个唯一的密钥，因此如果不禁用缓存或
增加提交间隔

赞(0）回复(0）举报 2021-06-07

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前