kafka连接从目录中读取文件

zqdjd7g9  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(338)

我正在将流媒体应用程序从flume移到kafka。所以我刚到Kafka就需要帮助。
我有一台windows机器,在这个机器上,物联网传感器在特定的位置(比如d:/文件夹)不断生成csv文件。我想把它转移到hadoop集群。
文件夹中每天都会生成数百万个小文件。我想把Kafka的新文件放到文件夹里。我应该使用哪个Kafka连接来假脱机目录中的新文件。我读过关于kafka connect filestream的文章,但我认为它只适用于一个文件。

vsikbqxv

vsikbqxv1#

使用Kafka连接。它支持读取文件夹中的所有csv文件
https://www.confluent.io/hub/jcustenborder/kafka-connect-spooldirhttpshttp://docs.confluent.io/current/connect/kafka-connect-spooldir/

相关问题