将字段插入到包中的相同位置

dm7nw8vv  于 2021-06-21  发布在  Pig
关注(0)|答案(0)|浏览(177)

我有一个inputfile.csv,我的目标是从数据包中拆分一个字段,经过一些其他处理后,我需要将它们连接回相同的位置。到目前为止我所做的是。

Data = load '$input' using PigStorage('$delimiter');
rankedoriginaldata = rank Data;
numericdata = foreach rankedoriginaldata generate $0,$split;

run命令

pig -x local -f seperator.pig -param input=data/StringNum.csv -param output=OUT/Numericfile -param delimiter="," -param split='$2'

rankedoriginaldata垃圾场
转储数字数据
上面的脚本将数据包中的$2拆分,并将其与行id一起添加到numericdata包中,以便为其保留一个id joining 回来。
从数据包我需要排除$分裂(例如:$2)和复制到另一个包。
预期数据或重复数据(不包括$2)
2.我需要将数值数据连接回其excat位置,并将inputdata作为结果返回。
如何做到这一点。
请建议一个更好的方法。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题