理解hadoop1.x中的mapreduce

ogsagwnx  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(264)

关于hadoop1.x的术语“mapreduce”是什么,我有点困惑。关于这一点,我遇到了各种术语,如: JobTracker , TaskTracker (mapreduce中的守护进程)。现在我们说mapreduce是指这些守护进程还是开发人员用来编写mapreduce应用程序的api?
用户应用程序是否在上执行 TaskTracker , JobTracker ? mapreduce本身是运行时环境吗?
谁能帮我用简单的话来理解这一点?

igsr9ssn

igsr9ssn1#

mapreduce是用于数据处理的编程模型(在hadoop中)。
它在hadoop-1.x中的实现通常被称为经典的mapreduce实现(或mapreducev1),它使用 JobTracker 以及 TaskTrackers 用于执行作业的hadoop和用于编写作业的相应api(面向用户的客户端特性)。 JobTracker 协调作业运行。 TaskTrackers 运行作业已拆分为的任务。
总而言之,mapreduceapi决定如何编写mapreduce编程模型,而实现决定如何执行使用此编程模型编写的作业。
mapreduce编程模型的yarn实现(mapreducev2)不同于用于编写它的api和守护进程( ResourceManager , ApplicationMaster 以及 NodeManagers )用于执行。

相关问题