spark作业的输出可以用作另一个spark作业的输入吗?

xbp102n0  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(311)

我想使用一个spark作业的输出作为另一个spark作业的输入数据。有可能吗?

qnakjoqk

qnakjoqk1#

对。只要输出存储在某个地方。

jjjwad0x

jjjwad0x2#

这两项工作的区别是什么?您可以在job#2中重用job#1中的rdd,或者(如前所述)您需要将它存储在某个位置,并在job#2的开头从那里读取它。

相关问题