对于天气数据示例,hadoop权威指南说“关键点是文件中的行偏移”。Map函数的键是如何确定的?它们总是输入文件中的行偏移吗?如果输入包含多个文件怎么办?
vom3gejh1#
hadoop中的默认输入格式是textinputformat。这在这里解释。在这种格式中,文件被分成几行,而键正好是从文件中获取行的位置。为了理解键和值是如何分配的,您需要阅读有关输入格式的内容,这将在本书后面的一整章中进行描述。祝你好运。
1条答案
按热度按时间vom3gejh1#
hadoop中的默认输入格式是textinputformat。这在这里解释。在这种格式中,文件被分成几行,而键正好是从文件中获取行的位置。
为了理解键和值是如何分配的,您需要阅读有关输入格式的内容,这将在本书后面的一整章中进行描述。
祝你好运。