是否有一个内置的inputformat,我可以在mapper函数中使用它来读取以下格式的输入行:
Name [key1#val1,key2#val2,key3#val3,key4#val4]
示例输入数据可能如下所示:
sanjose [population#123,area#123,address#1,jkui,ty,tz#PST]
delhi [population#1823,area#1023,address#1,jkui,ty,tz#IST]
boston [population#1823,area#1023,address#1,jkui,ty,tz#EST]
1条答案
按热度按时间lbsnaicq1#
设置属性
mapreduce.input.keyvaluelinerecordreader.key.value.separator
使用job.setInputFormatClass(KeyValueTextInputFormat.class);
对你来说我相信\t
是键值分隔符