我每天都有小文件进入hdfs。我计划使用hadoop归档(har),但是如何归档这些每天都会进入hdfs的小文件呢。例句:我今天可能会得到5个文件,我需要存档,明天如果我再得到5个文件,我需要把这个附加到前几天的存档中。
eagi6jfj1#
不能将文件添加到现有的har文件中。您需要取消归档并重新归档或共享文件几天,然后继续创建归档文件。
1条答案
按热度按时间eagi6jfj1#
不能将文件添加到现有的har文件中。您需要取消归档并重新归档或共享文件几天,然后继续创建归档文件。