我创造了一个 .parquet
使用map reduce job创建文件。现在我想在这个文件的顶部创建一个外部表。命令如下:
CREATE EXTERNAL TABLE testparquet (
NAME STRING,
AGE INT
)
STORED AS PARQUET
LOCATION 'file location'
表创建成功,但是当我使用simple查询表时 SELECT *
,我将所有字段的数据都设置为null。hive的版本是0.13。
有什么我不知道的吗?
1条答案
按热度按时间hts6caw31#
使用时
external
文件,则需要显式地将了解数据架构的元数据存储与实际数据本身同步。通常,您将使用
INVALIDATE METADATA
命令强制下列查询重新读取数据。你也可以使用REFRESH <table-name>
如果只有一个已更新的表。