我可以为只有一个输出文件的配置单元查询的输出选择自己的名称吗?

ezykj2lf  于 2021-06-04  发布在  Hadoop
关注(0)|答案(1)|浏览(248)

我得到了我的配置单元查询的多个输出文件。所以,我的第一个问题是,我是否可以将输出配置为只在一个文件中。另外,我可以选择自己的输出名称而不是0000吗?
仅供参考,我没有使用jar文件将作业提交给hadoop。取而代之的是,我在工作中使用Hive查询。那么,如何重命名输出文件名。

cpjpxq1n

cpjpxq1n1#

通过将减速器的数量设置为0,可以将单个文件作为输出。您可以通过配置单元cli执行此操作:

hive>  set mapred.reduce.tasks = 1;

是的,您可以更改输出文件的名称。可以将 OutputFormat.java 上课写你自己的。您可以查看textoutputformat.java和multipleoutputformat.java等的代码以供参考。要做到这一点,您只需对该类进行子类化,并重写需要更改的方法。

相关问题