使用pig按datetime列存储数据组

cvxl0en2  于 2021-06-25  发布在  Pig
关注(0)|答案(1)|浏览(285)

假设我有这样的数据集

1, 3, 2015-03-25 11-15-13
1, 4, 2015-03-26 11-16-14
1, 4, 2015-03-25 11-16-15
1, 5, 2015-03-27 11-17-11
...

我想按日期时间存储数据
因此,我将有以下输出文件夹

2015-03-25/
2015-03-26/
2015-03-27/
...

怎么处理Pig?
谢谢您

kyvafyod

kyvafyod1#

您可以使用多存储。
使用 FOREACH GENERATE 创建一个包含您感兴趣的日期部分的列

STORE X INTO '/my/home/output' USING MultiStorage('/my/home/output','2');

相关问题