没有输入文件的hadoop流作业

zrfyljdw 于 2021-06-03 发布在 Hadoop

关注(0)|答案(1)|浏览(291)

是否可以执行没有输入文件的hadoop流作业？
在我的用例中，我能够用一个Map器和执行参数为reducer生成必要的记录。目前，我正在使用一个只有一行的存根输入文件，我想删除这个要求。
我们考虑了两个用例。
1)
我想把文件从所有节点都可用的网络位置加载到hdfs中。基本上，我将在Map器中运行ls，并将输出发送到一小组reducer。
我们将对几个模型使用几个不同的参数范围进行拟合。当要运行的测试列表在Map器中生成时，模型名称不会更改，将作为键转到reducer。

hadoop hadoop-streaming

来源：https://stackoverflow.com/questions/22821005/hadoop-streaming-job-with-no-input-file