有人能帮我弄清楚为什么在使用register注册jar文件'elephant bird'来加载json数据时出错:
我在pig0.16的本地模式下工作,得到一个错误:/home/shanky/downloads/elephant-bird-hadoop-compat-4.1.jar'不存在/home/shanky/downloads/elephant-bird-pig-4.1.jar'不存在。
加载json数据的代码:
REGISTER '/home/shanky/elephant-bird-hadoop-compat-4.1.jar';
REGISTER '/home/shanky/Downloads/elephant-bird-pig-4.1.jar';
REGISTER '/home/shanky/Downloads/json-simple-1.1.1.jar';
load_tweets = LOAD '/home/shanky/Downloads/data.json' USING com.twitter.elephantbird.pig.load.JsonLoader('-nestedLoad') AS myMap;
dump load_tweets;
我试图通过删除引号和放入hdfs://来替换register语句,但没有任何效果。
1条答案
按热度按时间ukxgm1gy1#
报价不应包含在pig文件中(https://pig.apache.org/docs/r0.16.0/basic.html#register-jar),但您的语法确实适合我(不过我使用的是0.12.0-cdh5.12.0)。
既然你说你没用引号就试过了,我有一些想法: