使用elephantbird加载json-简单任务出错

w6mmgewl  于 2021-06-21  发布在  Pig
关注(0)|答案(1)|浏览(339)

我对简单地加载数据进行测试和分析有问题。我在用
https://www.reddit.com/r/datasets/comments/3oiv9z/reddit_september_comment_archive_is_now_available/
在使用从这个文件中只获得10000行之后,我尝试将它们加载到pig。
即使是像这样简单的返回错误。

REGISTER '/user/cloudera/json-simple-1.1.1.jar'
REGISTER '/user/cloudera/elephant-bird-pig-4.1.jar'
REGISTER '/user/cloudera/elephant-bird-hadoop-compat-4.1.jar'

a = LOAD '/user/cloudera/top' USING com.twitter.elephantbird.pig.load.JsonLoader() as (json:map[]);

错误代码:
主类[org.apache.oozie.action.hadoop.pigmain],退出代码[2]

dw1jzc5e

dw1jzc5e1#

试着运行这个

REGISTER 'elephant-bird-pig-4.1.jar';
REGISTER 'elephant-bird-hadoop-compat-4.1.jar';

input = LOAD '/input/file' USING com.twitter.elephantbird.pig.load.JsonLoader('-nestedLoad') AS input_map;

相关问题