我在hive中有一个Parquet表(在cloudera集群中,这是一个外部表)。当我执行select*from table\ U name命令时,它工作正常
但是,当我试图查看特定列的值时,我得到了outofmemory错误,尽管我将结果限制为只有10个。
select col_name from table_name limit 10;
java.lang.outofmemoryerror:java堆空间
失败:执行错误,从org.apache.hadoop.hive.ql.exec.mr.mapredtask返回代码-101。java堆空间
真奇怪。我不熟悉Parquet地板。非常感谢你在这方面的帮助。谢谢
从desc table命令检索到的配置单元表的其他信息:
# Storage Information
SerDe Library: org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe
InputFormat: org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat
OutputFormat: org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat
Compressed: No
Num Buckets: -1
Bucket Columns: []
Sort Columns: []
Storage Desc Params:
serialization.format 1
暂无答案!
目前还没有任何答案,快来回答吧!