在kafka connect中从单个消息写入多个条目

w41d8nur  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(366)

如果在一个主题上,我接收到一些表示相同结构列表的格式的消息(例如,json列表或protobuf中的重复字段),我是否可以配置kafka connect将列表中的每个条目作为一个单独的行写入(例如在hdfs中的parquet文件中,或在sql数据库中)?是否可以仅使用捆绑的转换器/连接器?
i、 我能用Kafka的每一条信息来代表数千条记录,而不是发送数千条单独的信息吗?
用Kafka连接实现这一目标的简单方法是什么?

ljsrvy3e

ljsrvy3e1#

捆绑的消息转换只能进行一对一的消息操作。因此,如果希望connect将这些扁平列表作为单独的记录写入,则必须以某种方式(直接或通过流处理应用程序)显式生成这些扁平列表。
或者,如果适用,您也可以使用hive或spark来扩展该列表以供以后处理。

相关问题