flume使用hdfs sink当hdfs不可用时,如何确保数据完整性?

j1dl9f46  于 2021-06-04  发布在  Flume
关注(0)|答案(1)|浏览(393)

当hdfs不可用时,是否有方法确保数据安全?场景是:kafka源、flume内存通道、hdfs接收器。如果flume服务关闭了,它是否可以存储topic分区的偏移量,并在恢复后从正确的位置进行消费?

fcg9iug3

fcg9iug31#

通常(使用默认配置),kafka为所有使用者存储主题偏移量。如果使用相同的组id(消费者属性之一)启动flume源,kafka将从源的偏移量开始发送消息。但是已经从kafka读取并存储在内存通道中的消息将由于hdfs接收器故障而丢失。

相关问题