我想在java代码中重写hadoop的默认记录读取器。默认情况下,它逐行读取记录。当它遇到“:”时我就改了。但是,在分离记录时,它也会发出分隔符。例如,我的记录是:
> I go to school : He goes to school : we go to school
读取记录时,会产生如下结果:
I go to school
He goes to school
we go to school
但是分隔符-“:”不见了。有没有办法把这个分隔符保存在记录中?因为定界符中可能有一些重要的信息。
暂无答案!
目前还没有任何答案,快来回答吧!