**结束。**此问题不符合堆栈溢出准则。它目前不接受答案。
**想改进这个问题吗?**更新问题,使其成为堆栈溢出的主题。
两年前关门了。
改进这个问题
我的目标是学习pig,以增强我的机器学习/统计分析工作的简历。目前我对所有的hadoop细节都不太感兴趣(尽管我很想稍后再学习,但在我的机器上设置起来非常困难,即使有指令,我更喜欢统计,而不是程序员)。有没有什么资源可以让我学习pig,并且可以很容易地访问它进行实验,而不必从头开始学习hadoop?
**结束。**此问题不符合堆栈溢出准则。它目前不接受答案。
**想改进这个问题吗?**更新问题,使其成为堆栈溢出的主题。
两年前关门了。
改进这个问题
我的目标是学习pig,以增强我的机器学习/统计分析工作的简历。目前我对所有的hadoop细节都不太感兴趣(尽管我很想稍后再学习,但在我的机器上设置起来非常困难,即使有指令,我更喜欢统计,而不是程序员)。有没有什么资源可以让我学习pig,并且可以很容易地访问它进行实验,而不必从头开始学习hadoop?
2条答案
按热度按时间bkkx9g8r1#
试一试cloudera quickstartvm,它包括一个现成的pig环境。
plicqrtu2#
对。安装清管器,然后在本地运行。它可以在本地完成它在hadoop上所能做的一切(尽管在大多数情况下速度较慢)。
对于交互式shell(grunt):
要在本地运行pig脚本:
关于如何使用pig的最好的文档已经在apache上了,他们也有一个非常好的教程。