我的问题陈述如下。我的Hive工作花了很多时间,我觉得Map绘制者的数量不够。输入表以Parquet文件格式存储数据,即其当前压缩大小远小于实际大小。因为它的压缩大小要小得多,所以分裂的数量也就少了。我相信压缩格式的文件会误导mapreduce。你能帮忙吗。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!