hadoop—用文件中的另一个名称替换名称

dfty9e19  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(294)

我是一个非常新的hadoop和我有擦洗的文件,其中帐户号,名称和地址的详细资料,我需要改变这些名称和地址的一些其他名称和地址的详细资料,这是存在于另一个文件的要求。我擅长mapreduce或hive。我需要帮助。谢谢您。

acruukt9

acruukt91#

您还可以使用配置单元来完成此任务。
根据您的清理逻辑编写hiveudf
对配置单元表中要清理并在新配置单元表中存储数据的每一列使用上述自定义项。
3.您可以移除旧的配置单元表。

twh00eeo

twh00eeo2#

您可以编写简单的mapper-only作业(reducer设置为零),更新信息并将它们存储在其他位置。验证作业的输出,如果如预期的那样,则删除旧文件。记住,hdfs不支持文件的编辑和重写。
hadoop-mapreduce教程。

相关问题