我有一个 HIVE
使用 JSON Serde
. 我用的是 Shark
分配(http://shark.cs.berkeley.edu/). 定义如下:
CREATE TABLE lastfm(
artist string,
title string ,
track_id string,
similars array<array<string>>,
tags array<array<string>>
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe';
我能够成功地将数据加载到此表中。现在,我创建了一个 Parquet
基于中的表 HIVE
.
CREATE TABLE lastfm_par (
artist string,
title string ,
track_id string,
similars array<array<string>>,
tags array<array<string>>
)
ROW FORMAT SERDE 'parquet.hive.serde.ParquetHiveSerDe'
STORED AS
INPUTFORMAT 'parquet.hive.DeprecatedParquetInputFormat'
OUTPUTFORMAT 'parquet.hive.DeprecatedParquetOutputFormat';
现在,我尝试从 JSON Serde
餐桌 Parquet
一个使用以下命令:
insert overwrite table lastfm_par select * from lastfm;
这个 insert
语句已成功完成。但是当我查询 Parquet
表中,所有列都填充了 NULL
价值观。我在网上搜索过类似的问题,但还没有看到类似的东西。有人对这里出了什么问题有什么想法吗?
谢谢,维萨克
暂无答案!
目前还没有任何答案,快来回答吧!