列出hdfs上zip文件的内容

ni65a41a  于 2021-07-15  发布在  Hadoop
关注(0)|答案(1)|浏览(385)

我在hdfs上有(巨大的)zip文件(不是gzip)。这些文件都包含多个文件。除了把它拉到本地,还有什么方法可以列出zip文件中的文件吗?就像zipinfo在linux上做的那样。

ncgqoxb0

ncgqoxb01#

hdfs不支持处理zip文件。
我知道在zip文件中列出文件太简单了,无法为其编写java代码,但您可能希望尝试使用mapreduce处理它们
尝试zipfileinputformat

相关问题