我是在Pig圈工作的新手。我在处理xml文件时遇到一个问题,我使用了以下命令:
register '/usr/lib/pig-0.12.0/contrib/piggybank/java/piggybank.jar'
pigdata = load '/xml1.xml' using org.apache.pig.piggybank.storage.XMLLoader('name') as (doc:chararray);
values = foreach pigdata GENERATE FLATTEN(REGEX_EXTRACT_ALL(doc,'<name>(.*)</name>')) AS (name:chararray);
dump values;
1条答案
按热度按时间cs7cruho1#
此问题可能是由于文件路径问题和/或权限问题造成的。请检查输入文件的hdfs文件路径是否存在于/user/edureka/xml1.xml。您还可以手动检查是否能够在中创建新文件吗hdfs://localhost:8020/tmp目录等排除权限问题。