嗨,我正在加载文件夹中的文件到hdfs使用Pig处理。文件夹名称的格式为mm dd yyyy。例如
/Test/02-10-2016/file1
/Test/02-11-2016/file2
/Test/20-12-2016/file3
同样地,测试文件夹包括日期从2015年1月1日到2016年12月20日。加载此文件夹时,我想排除一些日期文件,如02-10-2016、02-09-2016。
我知道我们可以在load语句中使用regex,比如
ex = load '/TEST/*';
像这样,如何使用regex排除load语句中的一些文件?
暂无答案!
目前还没有任何答案,快来回答吧!