有谁能告诉我,hcatalog在使用前需要安装吗?或者它可以作为jar文件使用?
我在虚拟机上运行cloudera,我可以毫无问题地使用hcatalog进行mr作业、pig和hive。我认为同样的mr代码可以在另一个安装了hadoop的平台上工作,但显然不是这样,hcatinputformat.setinput()上抛出了异常。当我使用 Pig -useHCatalog
,我被提示用法错误,也就是说它不知道是什么 -useHCatalog
作为参数。
以前没有想过这一点,因为在cloudera上使用hcatalog。。。
2条答案
按热度按时间8cdiaqws1#
是的,您需要安装并启动hcatalog服务器。hcatalog应该附带最新的hive tar包。
查看这里的apache配置单元文档了解详细信息,
基本上你需要,
为hcatalog设置mysql数据库
运行服务器安装脚本
share/hcatalog/scripts/hcat\u server\u install.sh-r root-d dbroot-h hadoop\u home-p portnum
启动hcatalog服务器
export hive\u home=hive\u home$hive\u home/sbin/hcat\u server.sh启动
uqcuzwp82#
如前所述,如果您使用的是hive0.12或更高版本,则不需要单独安装hcatalog。