我得到了我的配置单元查询的多个输出文件。所以,我的第一个问题是,我是否可以将输出配置为只在一个文件中。另外,我可以选择自己的输出名称而不是0000吗?仅供参考,我没有使用jar文件将作业提交给hadoop。取而代之的是,我在工作中使用Hive查询。那么,如何重命名输出文件名。
cpjpxq1n1#
通过将减速器的数量设置为0,可以将单个文件作为输出。您可以通过配置单元cli执行此操作:
hive> set mapred.reduce.tasks = 1;
是的,您可以更改输出文件的名称。可以将 OutputFormat.java 上课写你自己的。您可以查看textoutputformat.java和multipleoutputformat.java等的代码以供参考。要做到这一点,您只需对该类进行子类化,并重写需要更改的方法。
OutputFormat.java
1条答案
按热度按时间cpjpxq1n1#
通过将减速器的数量设置为0,可以将单个文件作为输出。您可以通过配置单元cli执行此操作:
是的,您可以更改输出文件的名称。可以将
OutputFormat.java
上课写你自己的。您可以查看textoutputformat.java和multipleoutputformat.java等的代码以供参考。要做到这一点,您只需对该类进行子类化,并重写需要更改的方法。