我的代码部署在hdfs上,有两个基本任务,我很难搞清楚-
从objectstore获取zip文件到hdfs,在hdfs上解压缩,读取其内容,删除zip和内容。
在hdfs上创建一些内容,在hdfs上压缩,将其发布到objectstore,然后删除zip。
在python脚本(如shutil等)中用于压缩/解压缩的常规库在引用资源时不适用于hdfs url。我试着查找一些允许它的python库,但没有找到。
我得到的最接近的解决方案是这个,但它附带了一个公平的警告:当多个文件压缩在一起时,将无法工作。有人能帮忙用黑体字指向上面提到的任务的解决方案吗?
暂无答案!
目前还没有任何答案,快来回答吧!