将数据从基于json serde的配置单元表加载到parquet表的问题

mbjcgjjk  于 2021-06-02  发布在  Hadoop
关注(0)|答案(0)|浏览(263)

我有一个 HIVE 使用 JSON Serde . 我用的是 Shark 分配(http://shark.cs.berkeley.edu/). 定义如下:

CREATE TABLE lastfm(
artist string,
title string ,
track_id string,
similars array<array<string>>,
tags array<array<string>>
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe';

我能够成功地将数据加载到此表中。现在,我创建了一个 Parquet 基于中的表 HIVE .

CREATE TABLE lastfm_par (
  artist string,
  title string ,
    track_id string,
    similars array<array<string>>,
    tags array<array<string>>
)
ROW FORMAT SERDE 'parquet.hive.serde.ParquetHiveSerDe'
 STORED AS
 INPUTFORMAT 'parquet.hive.DeprecatedParquetInputFormat'
 OUTPUTFORMAT 'parquet.hive.DeprecatedParquetOutputFormat';

现在,我尝试从 JSON Serde 餐桌 Parquet 一个使用以下命令:

insert overwrite table lastfm_par select * from lastfm;

这个 insert 语句已成功完成。但是当我查询 Parquet 表中,所有列都填充了 NULL 价值观。我在网上搜索过类似的问题,但还没有看到类似的东西。有人对这里出了什么问题有什么想法吗?
谢谢,维萨克

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题