我正在用javahadoop为你写一个程序 MapReduce . 我有一些问题 TextInputFormat 因为它需要一个 LongWritable 但是在我的代码中,我没有它的任何部分(我编写了一个新类)。所以我需要一节新课 InputFormat 以我的新类的一个示例作为输入。有什么帮助吗?
MapReduce
TextInputFormat
LongWritable
InputFormat
jjhzyzn01#
对于textinputformat,framework读取每一行,其中lineoffset作为键,line作为值。如果它是文本数据,并且每一行都是记录,那么您应该使用textinputformat,作为Map器的一部分,您需要处理每条记录。
cbwuti442#
你不用担心- TextInputFormat 对你来说很合适。在 TextInputFormat 您将获得每一行数据作为 Text Map器值中的对象。这个 LongWritable 只是文件中行开始的字节偏移量。很少用这个 LongWritable ,而大多数乔布斯在Map绘制程序中都忽略了这一点。您可以在不更改数据的情况下使用此输入格式。
Text
2条答案
按热度按时间jjhzyzn01#
对于textinputformat,framework读取每一行,其中lineoffset作为键,line作为值。如果它是文本数据,并且每一行都是记录,那么您应该使用textinputformat,作为Map器的一部分,您需要处理每条记录。
cbwuti442#
你不用担心-
TextInputFormat
对你来说很合适。在
TextInputFormat
您将获得每一行数据作为Text
Map器值中的对象。这个LongWritable
只是文件中行开始的字节偏移量。很少用这个LongWritable
,而大多数乔布斯在Map绘制程序中都忽略了这一点。您可以在不更改数据的情况下使用此输入格式。