关闭。这个问题是基于意见的。它目前不接受答案。**想改进这个问题吗?**更新这个问题,这样就可以通过编辑这篇文章用事实和引文来回答。
6年前关门了。改进这个问题在python客户端搜索hadoop时,我发现了两个模块pydoop和hadoopy。似乎两者都可以很好地配合使用,但不确定哪一个比另一个更有优势来安装一个。
kiayqfof1#
我认为最全面的文档是http://blog.cloudera.com/blog/2013/01/a-guide-to-python-frameworks-for-hadoop/最近,我真的认为mrjob已经作为一个明显的领跑者走在了前面。它有一个非常活跃的邮件列表,似乎是相对稳定和最新的。它还与amazon emr进行了很好的集成。
1条答案
按热度按时间kiayqfof1#
我认为最全面的文档是http://blog.cloudera.com/blog/2013/01/a-guide-to-python-frameworks-for-hadoop/
最近,我真的认为mrjob已经作为一个明显的领跑者走在了前面。它有一个非常活跃的邮件列表,似乎是相对稳定和最新的。它还与amazon emr进行了很好的集成。