可定制的输入格式hadoop

8oomwypt  于 2021-06-02  发布在  Hadoop
关注(0)|答案(2)|浏览(273)

我正在用javahadoop为你写一个程序 MapReduce . 我有一些问题 TextInputFormat 因为它需要一个 LongWritable 但是在我的代码中,我没有它的任何部分(我编写了一个新类)。所以我需要一节新课 InputFormat 以我的新类的一个示例作为输入。有什么帮助吗?

jjhzyzn0

jjhzyzn01#

对于textinputformat,framework读取每一行,其中lineoffset作为键,line作为值。如果它是文本数据,并且每一行都是记录,那么您应该使用textinputformat,作为Map器的一部分,您需要处理每条记录。

cbwuti44

cbwuti442#

你不用担心- TextInputFormat 对你来说很合适。
TextInputFormat 您将获得每一行数据作为 Text Map器值中的对象。这个 LongWritable 只是文件中行开始的字节偏移量。很少用这个 LongWritable ,而大多数乔布斯在Map绘制程序中都忽略了这一点。您可以在不更改数据的情况下使用此输入格式。

相关问题