在我的pig脚本(0.9.2)中,我的最终输出如下所示: final: {email: chararray,{(name: chararray,percent: double)}}
其中每个电子邮件地址,我有多达3个名字和分数。所以,输出应该是这样的: joe@smith.com {(Joe Smith, 0.5),(Joseph, 0.1), (Joey, 0.1)}
我真正想做的是将其展平为带制表符的delimted值(没有括号或大括号),以便更轻松地拉入mysql表,如下所示: joe@smith.com Joe Smith 0.5 Joseph 0.1 Joey 0.1
我怎样才能在Pig身上做到这一点?或者我必须编写自定义自定义自定义项?
2条答案
按热度按时间bwntbbo31#
我编写了一个javaudf,它可以很好地处理一包元组。tuple.todelimitedstring是关键。
drnojrws2#
您需要为此编写自定义自定义自定义项。用python这样的语言很容易做到。做一些类似的事情:
只需将其放入.py文件并按如下方式加载:
然后像这样使用: