Kafka中是否有将多个记录写入一个S3对象的配置？

q0qdq0h2 于 2022-11-21 发布在 Apache

关注(0)|答案(1)|浏览(136)

我正在使用S3 Sink连接器从Kafka向S3写入记录。最终我将使用Kafka从我的数据库捕获CDC数据包，然后将这些数据包写入S3。
但是，我不希望每一个CDC数据包（在Kafka看来是一个记录）都被写入一个单独的S3对象。我希望配置一个基于大小或时间的条件，以便每X秒或Y字节的所有记录都被写入一个S3对象。
我还没有找到任何可以将记录写入一个对象的东西，但是我找到了Kafka Consumer属性fetch.min.bytes和fetch.max.wait.ms，它们每X秒或Y字节写入一次对象--但是多个记录仍然作为单独的对象写入。

apache-kafka

来源：https://stackoverflow.com/questions/74429955/is-there-a-configuration-in-kafka-to-write-multiple-records-to-one-s3-object