通过nifi的微批处理

ifsvaxew  于 2021-06-06  发布在  Kafka
关注(0)|答案(1)|浏览(329)

我有一个场景,其中我的kafka消息(来自同一主题)通过一个浓缩管道,并在最后写入hdfs和mongodb。我的Kafka消费者的hdfs将运行每小时为基础(微批处理)。因此,我需要知道将流文件路由到puthdfs和putmango的最佳方法,该方法基于流文件来自哪个使用者(用于hdfs的使用者或用于mongo db的使用者)。
或者,请建议是否有任何其他方法,通过nifi实现微配料。
谢谢

4sup72z8

4sup72z81#

您可以将nifi设置为对上载数据的处理器使用调度策略。
我想你应该希望kafka的消费者总是读取数据,在nifi中建立一个流文件的积压,然后让puts以较少的频率运行。
这类似于kafka connect为其hdfs连接器运行的方式

相关问题