如何将存储在awss3中的jar提交给本地spark?

o4tp2gmn  于 2021-05-27  发布在  Spark
关注(0)|答案(1)|浏览(370)

问题:如何将存储在awss3中的jar提交给localspark?
我正在寻找一种将存储在s3中的jar提交给localspark(而不是emr)的方法。然而,当我调查这个问题时,我只看到如何将它提交给emr spark cluster。
最接近的答案,我一直在寻找的方法是在链接。然而,上述答案似乎只适用于电子病历(不是吗?我可能错了。)

3mpgtkmj

3mpgtkmj1#

spark文档中说:
spark使用以下url方案来允许使用不同的策略来传播JAR:
file:-绝对路径和file:/uri由驱动程序的http文件服务器提供服务,每个执行器从驱动程序http服务器提取文件。
hdfs:、http:、https:、ftp:-这些文件和jar按预期从uri中下拉
local:-以local:/开头的uri应作为本地文件存在于每个工作节点上。
因此,只要您的s3 bucket是公共的并且您可以使用uri访问它,您就可以指定上面提到的其中一个

相关问题