在使用jsonloader从json文件使用pig时,我试图输入数据集的模式。
数据格式如下:
{
'cat_a':'some_text',
'cat_b':{(attribute_name):(attribute_value)}
}
我试图将模式描述为:
LOAD 'filename' USING JsonLoader('cat_a:chararray, cat_b:(attribute_name:chararray,attribute_value:int)');
我觉得我描述的模式不对 cat_b
.
有人能帮忙吗?提前谢谢。
1条答案
按热度按时间aamkag611#
如果你的json是
将上述json存储在
test.json
运行以下命令您将输出为
如果你的json格式如下
输出将是