如何读取分组输出和中断?

34gzjxbg  于 2021-06-24  发布在  Pig
关注(0)|答案(1)|浏览(329)

我有一个pig输出文件,其原始数据如下所示(2个字段):

(45578713,45578728,)    8139

第一个字段是前一个pig作业的组字段(我不能更改)。
现在我需要读一下这个,我想把第一个字段(4557871345578728,)分解成如下的单个数字(总共3个字段)

45578713        45578728        8139

我该怎么做?我试图使用Pig流,但我觉得一定有什么我可以从Pig直接做。

dldeef67

dldeef671#

这应该对你有帮助。 m = FOREACH g GENERATE FLATTEN(group), number; 看一看 FLATTEN 接线员。

相关问题