无法在pig中处理xml

vhmi4jdf  于 2021-06-21  发布在  Pig
关注(0)|答案(1)|浏览(302)

我是在Pig圈工作的新手。我在处理xml文件时遇到一个问题,我使用了以下命令:

register '/usr/lib/pig-0.12.0/contrib/piggybank/java/piggybank.jar'
pigdata = load '/xml1.xml' using org.apache.pig.piggybank.storage.XMLLoader('name') as (doc:chararray);

values = foreach pigdata GENERATE FLATTEN(REGEX_EXTRACT_ALL(doc,'<name>(.*)</name>')) AS (name:chararray);

dump values;

cs7cruho

cs7cruho1#

此问题可能是由于文件路径问题和/或权限问题造成的。请检查输入文件的hdfs文件路径是否存在于/user/edureka/xml1.xml。您还可以手动检查是否能够在中创建新文件吗hdfs://localhost:8020/tmp目录等排除权限问题。

相关问题