**结束了。**这个问题离题了。它目前不接受答案。**想改进这个问题吗?**更新问题,使其成为堆栈溢出的主题。
8年前关门了。改进这个问题最近我在学习hadoop时遇到了一个问题,我只找到了一个读取文本数据和计算字数的例子。几乎所有的例子都是同一个任务。请帮助我理解它是hadoop的唯一用例吗?请为我提供一些更真实的用例的参考资料,或者在哪里我可以理解和编写hadoop可以在哪里使用。谢谢
ux6nzvsh1#
我可以试着概述几个限制自己使用mapreduce的方向:a)etl数据转换。hadoop在这里大放异彩,因为延迟并不重要,但可伸缩性很重要b) Hive/Pig。有些情况下,我们需要在大数据集上实际使用sql或类似sql的功能,但却买不起商业mpp数据库c) 不同种类的原木加工。d) 深度分析—当我们只想在海量数据上运行java代码时。mahaout在许多情况下被用作机器学习库。
1条答案
按热度按时间ux6nzvsh1#
我可以试着概述几个限制自己使用mapreduce的方向:a)etl数据转换。hadoop在这里大放异彩,因为延迟并不重要,但可伸缩性很重要
b) Hive/Pig。有些情况下,我们需要在大数据集上实际使用sql或类似sql的功能,但却买不起商业mpp数据库
c) 不同种类的原木加工。
d) 深度分析—当我们只想在海量数据上运行java代码时。mahaout在许多情况下被用作机器学习库。