以下是 dump 变量的 data .
dump
data
(104) (105) (106) (107) (108) (111) (112) (113) (114) (115) (119) (120)
如何将其转换为 bag 的 tuples 如下(无 UDF 最好是):
bag
tuples
UDF
{(104),(105),(106),(107),(108),(111),(112),(113),(114),(115),(119),(120)}
rm5edbpk1#
使用 GROUP ALL http://pig.apache.org/docs/r0.16.0/basic.html#group如果你想把所有元组放到一个组中,就使用all;例如,在对整个关系进行聚合时。
GROUP ALL
A = LOAD '/tmp/data.txt' AS (n:int); B = GROUP A ALL; C = FOREACH B GENERATE $1;
1条答案
按热度按时间rm5edbpk1#
使用
GROUP ALL
http://pig.apache.org/docs/r0.16.0/basic.html#group如果你想把所有元组放到一个组中,就使用all;例如,在对整个关系进行聚合时。