从Kafka连接到s3的Parquet输出

fd3cxomn  于 2021-06-08  发布在  Kafka
关注(0)|答案(3)|浏览(457)

我看到kafkaconnect可以用avro或json格式写入s3。但没有Parquet地板的支持。这有多难添加?

agxfikkp

agxfikkp1#

从Confluent5.4.0开始,官方支持将parquet输出到s3。

qeeaahzv

qeeaahzv2#

qubole连接器支持写Parquet-https://github.com/qubole/streamx

h9a6wy2h

h9a6wy2h3#

尝试 secor : https://github.com/pinterest/secor
可以与aws s3、谷歌云、azure的blob存储等配合使用。
请注意,您选择的解决方案必须具有以下关键特性:保证每个消息只写一次、负载分布、容错、监视、分区数据等。 Secor 如前所述,您可以轻松地使用其他“s3”样式的服务。。

相关问题