apache pig分配和解析问题

9njqaruj 于 2021-06-21 发布在 Pig

关注(0)|答案(2)|浏览(317)

目前正在用hadoop学习apachepig，并使用了6200万个庞大的数据集。只是试着做一个正常的计数函数，不断地得到错误。我已经分配了8gig的ram，我可以很容易地用hive来完成，但是似乎遇到了解析问题或堆分配问题，每次都不一样。我在虚拟机上使用hadoop。
错误包括：
文件script.pig，第3行，第39列>未能生成逻辑计划。嵌套异常：org.apache.pig.backend.executionengine.executexception:错误1070:无法使用导入解析计数：[，java.lang.，org.apache.pig.builtin.，org.apache.pig.impl.builtin.]
error org.apache.pig.pigserver-解析期间异常：解析期间出错。无法使用导入解析计数：[，java.lang.，org.apache.pig.builtin.，org.apache.pig.impl.builtin.]
错误1070:无法使用导入解析计数：[，java.lang.，org.apache.pig.builtin.，org.apache.pig.impl.builtin.]
error org.apache.pig.tools.grunt.grunt-错误1070:无法使用导入解析计数：[，java.lang.，org.apache.pig.builtin.，org.apache.pig.impl.builtin.]
我的Pig代码

a = LOAD 'bigData_orc' using org.apache.hive.hcatalog.pig.HCatLoader();
b = group a ALL;
c = foreach b generate group as rap, count(a) as counter;
dump c;`

Java hortonworks-sandbox apache-pig

来源：https://stackoverflow.com/questions/39130220/apache-pig-allocation-parsing-issue-with-count