在hadoop中处理小文件的zip

olhwl3o2  于 2021-06-03  发布在  Hadoop
关注(0)|答案(0)|浏览(192)

我有一个1GB的压缩文件,其中包含大约1000万个小文件。使用zipinputstream导入zip文件已经足够了吗?还是我仍然会面临“hadoop小文件问题”。
也请提及任何更好的方法来解决这个问题。基本上我想解析每个小文件的内容并对其进行一些处理。
谢谢

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题