hadoop emr-使用4mz(zstd)压缩时出现物理内存错误

332nm8kg  于 2021-05-29  发布在  Hadoop
关注(0)|答案(0)|浏览(245)

我的hadoop集群在aws emr中运行有问题。
当我用lzo或bz2压缩运行集群步骤时,一切都正常。问题是,我想要一个更好的压缩,也可以处理分裂,所以我去使用4mz(或zstd)从https://github.com/carlomedas/4mc.
现在,当我运行群集时,它会失败,并出现一个错误: ... is running beyond physical memory limits. Current usage: 4.6 GB of 4 GB physical memory used; 6.3 GB of 20 GB virtual memory used. Killing container. ... 我试着用 mapreduce.reduce.memory.mb 但它仍然失败了(只是后来。。。看起来减速机在失效前完成了更多的压缩)。
我想知道为什么使用这种新的压缩类型会使我的集群失败?
我的集群:8个c4.xlarge示例
谢谢!

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题