假设我有下面这样的模式
{
"name": "phoneNumber",
"type": {
"type": "record",
"name": "internalNumber",
"namespace": "com.wiki",
"fields": [{
"name": "areacode",
"type": "string",
}, {
"name": "phone",
"type": ["null", "string"],
"doc": "Acutal full number",
"default": null
}]
}
}
我有一个csv,它把这些数据分散到多个列中,比如:
areaCode phoneNumber
+1 1234512345
如何从pig脚本获得如下avro文件:
"phoneNumber" : {
"areacode" : "+1",
"phone" : "1234512345"
}
因为它是嵌套的。
1条答案
按热度按时间8yparm6h1#
你需要装Pig油的和Pig油罐里的存货