我正在用java编写一个基本的hadoop字数计算函数,需要将输出格式化为(k:v)而不是默认值(k'\t'v)。到目前为止,我只找到了使用keyvaluetextinputformat(已弃用)格式化输入分隔符的方法,而输出格式似乎没有相应的版本。有没有简单的方法?
btxsgosb1#
可通过设置此参数来实现 mapred.textoutputformat.separator 在 configuration 从作业到所需的分隔符。你的情况是 conf.set("mapred.textoutputformat.separator", ":"); . 根据hadoop的版本和发行版,参数名可能会有所不同。
mapred.textoutputformat.separator
configuration
conf.set("mapred.textoutputformat.separator", ":");
1条答案
按热度按时间btxsgosb1#
可通过设置此参数来实现
mapred.textoutputformat.separator
在configuration
从作业到所需的分隔符。你的情况是conf.set("mapred.textoutputformat.separator", ":");
. 根据hadoop的版本和发行版,参数名可能会有所不同。