我有一个json文件,格式如下:
"Properties2":[{"K":"A","T":"String","V":"M "}, {"K":"B","T":"String","V":"N"}, {"K":"D","T":"String","V":"O"}]
"Properties2":[{"K":"A","T":"String","V":"W”"},{"K":"B","T":"String","V":"X"},{"K":"C","T":"String","V":"Y"},{"K":"D","T":"String","V":"Z"}]
我想使用pig从上述json格式中提取表格式的数据:
预期格式:
注意:-在第一条记录中,c列应为空或null,因为在第一条记录中,c列没有值。
我尝试了jsonload和eliphantbird jar,但是没有得到预期的输出请建议我任何正确的方法来获得预期的输出。
1条答案
按热度按时间ff29svar1#
你能试试这个自定义自定义自定义项吗?
样本输入1:
输入.json
Pig手稿:
输出:
样本输入2:
输出2:
udf代码:下面的java文件编译生成为
jsonparse.jar
(这只是一个临时的java代码,您可以根据需要进行优化或修改)jsonparse.java文件
如何编译和构建jar文件:
命令行示例: