假设我有这样的数据集
1, 3, 2015-03-25 11-15-13 1, 4, 2015-03-26 11-16-14 1, 4, 2015-03-25 11-16-15 1, 5, 2015-03-27 11-17-11 ...
我想按日期时间存储数据因此,我将有以下输出文件夹
2015-03-25/ 2015-03-26/ 2015-03-27/ ...
怎么处理Pig?谢谢您
kyvafyod1#
您可以使用多存储。使用 FOREACH GENERATE 创建一个包含您感兴趣的日期部分的列
FOREACH GENERATE
STORE X INTO '/my/home/output' USING MultiStorage('/my/home/output','2');
1条答案
按热度按时间kyvafyod1#
您可以使用多存储。
使用
FOREACH GENERATE
创建一个包含您感兴趣的日期部分的列