我有一个包含3ed列数据的文件,我想用pig过滤这些数据,并对其执行其他操作。字符串类似于%d0%90%d0%bb%d0%b0,所有其他字符串都比较相似,但包含%char。如何过滤数据我正在做的是
Z = FILTER A BY not (a3 matches '.*%%D0%%*.');
ki0zmccv1#
首先,确保a3是字符集。然后,你应该这样过滤:
Z= FILTER A BY NOT a3 MATCHES '.*%D0%.*';
据我所知,没有必要转义%,如果要过滤那些不包含%d0%的内容,应该只放一个%。但是,如果要筛选那些不包含%%d0%%的表达式,则表达式应该可以正常工作。
q8l4jmvw2#
这在我的案例中起了作用:
Z = FILTER A BY NOT a3 matches '.*.[%].*.';
通过使用此筛选器,我可以删除包含“%”的行
2条答案
按热度按时间ki0zmccv1#
首先,确保a3是字符集。然后,你应该这样过滤:
据我所知,没有必要转义%,如果要过滤那些不包含%d0%的内容,应该只放一个%。但是,如果要筛选那些不包含%%d0%%的表达式,则表达式应该可以正常工作。
q8l4jmvw2#
这在我的案例中起了作用:
通过使用此筛选器,我可以删除包含“%”的行