我在hdfs上有(巨大的)zip文件(不是gzip)。这些文件都包含多个文件。除了把它拉到本地,还有什么方法可以列出zip文件中的文件吗?就像zipinfo在linux上做的那样。
ncgqoxb01#
hdfs不支持处理zip文件。我知道在zip文件中列出文件太简单了,无法为其编写java代码,但您可能希望尝试使用mapreduce处理它们尝试zipfileinputformat
1条答案
按热度按时间ncgqoxb01#
hdfs不支持处理zip文件。
我知道在zip文件中列出文件太简单了,无法为其编写java代码,但您可能希望尝试使用mapreduce处理它们
尝试zipfileinputformat