hadoop—Map和reduce操作是如何实际执行的

vlju58qv 于 2021-06-02 发布在 Hadoop

关注(0)|答案(1)|浏览(338)

我已经问过这个问题了，有人能给出正确的答案和解释吗？
哪个最能描述textinputformat如何处理输入文件和换行符？
答。输入文件拆分可能会跨换行符。跨文件拆分的行由包含虚线开头的拆分的recordreader读取。
b。输入文件拆分可能会跨换行符。跨文件拆分的行由两个包含虚线的拆分的RecordReader读取。
c。输入文件在换行符处被完全拆分，因此每个recordreader将读取一系列完整的行。
d。输入文件拆分可能会跨换行符。与文件拆分交叉的行将被忽略。
e。输入文件拆分可能会跨换行符。跨文件拆分的行由包含虚线结尾的拆分的recordreader读取。
提前谢谢

hadoop mapreduce

来源：https://stackoverflow.com/questions/31934801/how-map-and-reduce-operations-are-actually-carried-out

1条答案

按热度按时间

1wnzp6jl1#

linerecordreader读取Map调用的值，直到它遇到新行（或其他分隔符（如果指定）），这是下面对textinputformat类型的调用的帮助。所以很明显，一个记录永远不会结束，除非它遇到一个新的行。

newSize = in.readLine(value, maxLineLength, Math.max((int)Math.min(Integer.MAX_VALUE, end-pos),maxLineLength));

所以选择a是有效的。
输入文件拆分可能会跨换行符。跨文件拆分的行由包含虚线开头的拆分的recordreader读取。

赞(0）回复(0）举报 2021-06-02

我来回答

hadoop—Map和reduce操作是如何实际执行的

1条答案

相关问题

热门标签

最新问答