如何使用Flume按年份和月份对txt/csv文件中的数据进行分区?是否可以使HDFS路径动态化?

iyzzxitl  于 2022-12-09  发布在  HDFS
关注(0)|答案(1)|浏览(177)

我想配置一个flume flow,使其接收CSV文件作为源,检查数据,并在HDFS中按年/月动态地将每行数据分隔到文件夹中。

h5qlskok

h5qlskok1#

我建议你考虑使用Nifi,我觉得它是Flume的天然替代品。
话虽如此,您似乎需要考虑使用假脱机目录源和配置单元接收器(而不是hdfs)。配置单元分区(按年/月分区)将使您能够以您建议的方式来放置数据。

相关问题