我正在学习spark,我已经知道rdd可以保存依赖信息,并且rdd可以得到一个首选位置列表来计算每个分割。但我对他们的互动方式感到困惑。驱动程序是否提供rdd信息如果我检查rdd,它的孩子如何得到位置?子rdd是在scheduler开始时获取父rdd的位置,还是只有父rdd完成数据计算后才能获取信息?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!