我已经问过这个问题了,有人能给出正确的答案和解释吗?
哪个最能描述textinputformat如何处理输入文件和换行符?
答。输入文件拆分可能会跨换行符。跨文件拆分的行由包含虚线开头的拆分的recordreader读取。
b。输入文件拆分可能会跨换行符。跨文件拆分的行由两个包含虚线的拆分的RecordReader读取。
c。输入文件在换行符处被完全拆分,因此每个recordreader将读取一系列完整的行。
d。输入文件拆分可能会跨换行符。与文件拆分交叉的行将被忽略。
e。输入文件拆分可能会跨换行符。跨文件拆分的行由包含虚线结尾的拆分的recordreader读取。
提前谢谢
1条答案
按热度按时间1wnzp6jl1#
linerecordreader读取Map调用的值,直到它遇到新行(或其他分隔符(如果指定)),这是下面对textinputformat类型的调用的帮助。所以很明显,一个记录永远不会结束,除非它遇到一个新的行。
所以选择a是有效的。
输入文件拆分可能会跨换行符。跨文件拆分的行由包含虚线开头的拆分的recordreader读取。