我定义了一个Hive表,其中一列包含JSON文本:
CREATE EXTERNAL TABLE IF NOT EXISTS my.rawdata (
json string
)
PARTITIONED BY (dt string)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
'separatorChar' = '\n',
'quoteChar' = '\0',
'escapeChar' = '\r'
)
STORED AS TEXTFILE
LOCATION 's3://mydata/';
字符串
是否有一个Presto/Athena查询可以列出JSON中出现的所有字段名称及其频率(即属性在表中出现的总次数)?
2条答案
按热度按时间bpsygsoo1#
使用JSON函数解析JSON并将其转换为map。然后提取键并将其解嵌套。最后,使用普通的SQL聚合:
字符串
i2loujxw2#
字符串