在pig中转储字符串或(字符串,整数)元组

neskvpey  于 2021-06-25  发布在  Pig
关注(0)|答案(1)|浏览(316)

我有一个简单的pig脚本,我能够读取数据并转储数据。但是,我未能转储字符串或(string,int)元组。只是想知道我错过了什么?谢谢!

dataset = LOAD '/Users/me/input' USING PigStorage() AS (id:chararray,data:chararray);

dataset_GROUP = GROUP dataset ALL;
dataset_COUNT = FOREACH dataset_GROUP GENERATE COUNT(dataset);

DUMP "record_count = ";                 <-- this does not work
DUMP dataset_COUNT;                     <-- this works 
DUMP "record_count = ", dataset_COUNT;  <-- this does not work
r55awzrz

r55awzrz1#

你可以用 CONCAT() apache pig的函数将字符串连接到结果中,如下所示:

dataset = LOAD '/Users/me/input' USING PigStorage() AS (id:chararray,data:chararray);

dataset_GROUP = GROUP dataset ALL;
dataset_COUNT = FOREACH dataset_GROUP GENERATE CONCAT('record_count = ', COUNT(dataset));

DUMP dataset_COUNT;

有关ApachePig0.13.0的concat()的更多详细信息,请点击此处
如果您使用的是较旧的pig版本,那么您可以编写用户定义函数(udf),该函数将执行concatation操作并返回结果。有关更多详细信息,请参阅有关自定义项的pig文档

相关问题