关于hadoop1.x的术语“mapreduce”是什么,我有点困惑。关于这一点,我遇到了各种术语,如: JobTracker , TaskTracker (mapreduce中的守护进程)。现在我们说mapreduce是指这些守护进程还是开发人员用来编写mapreduce应用程序的api?用户应用程序是否在上执行 TaskTracker , JobTracker ? mapreduce本身是运行时环境吗?谁能帮我用简单的话来理解这一点?
JobTracker
TaskTracker
igsr9ssn1#
mapreduce是用于数据处理的编程模型(在hadoop中)。它在hadoop-1.x中的实现通常被称为经典的mapreduce实现(或mapreducev1),它使用 JobTracker 以及 TaskTrackers 用于执行作业的hadoop和用于编写作业的相应api(面向用户的客户端特性)。 JobTracker 协调作业运行。 TaskTrackers 运行作业已拆分为的任务。总而言之,mapreduceapi决定如何编写mapreduce编程模型,而实现决定如何执行使用此编程模型编写的作业。mapreduce编程模型的yarn实现(mapreducev2)不同于用于编写它的api和守护进程( ResourceManager , ApplicationMaster 以及 NodeManagers )用于执行。
TaskTrackers
ResourceManager
ApplicationMaster
NodeManagers
1条答案
按热度按时间igsr9ssn1#
mapreduce是用于数据处理的编程模型(在hadoop中)。
它在hadoop-1.x中的实现通常被称为经典的mapreduce实现(或mapreducev1),它使用
JobTracker
以及TaskTrackers
用于执行作业的hadoop和用于编写作业的相应api(面向用户的客户端特性)。JobTracker
协调作业运行。TaskTrackers
运行作业已拆分为的任务。总而言之,mapreduceapi决定如何编写mapreduce编程模型,而实现决定如何执行使用此编程模型编写的作业。
mapreduce编程模型的yarn实现(mapreducev2)不同于用于编写它的api和守护进程(
ResourceManager
,ApplicationMaster
以及NodeManagers
)用于执行。