我有一个配置单元数据库-我创建了一个表,与Parquet文件类型兼容。
CREATE EXTERNAL TABLE `default.table`(
`date` date,
`udid` string,
`message_token` string)
PARTITIONED BY (
`dt` date)
ROW FORMAT SERDE
'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
LOCATION
's3://Bucket/Folder')
我将分区添加到此表中,但无法查询数据。
在配置单元中:使用“show partitions from default.table”时可以看到分区,使用“select count()from default.table”时可以得到查询数。
在presto中:当使用“show partitions from default.table”时,我可以看到分区,但是当我尝试查询数据本身时-看起来没有数据-使用“select”返回空,尝试“select count(*)时返回0。
hive cluster是aws emr,版本:emr-5.9.0,应用程序:hive 2.3.0,presto 0.184,示例类型:r3.2xlarge。
有人知道我为什么会有Hive和普雷斯托的区别吗?谢谢!
暂无答案!
目前还没有任何答案,快来回答吧!