有没有办法“预编译”spark优化计划，这样就不需要每次都重新计算？

rn0zuynd 于 2022-11-25 发布在 Apache

关注(0)|答案(1)|浏览(102)

如果我有一个应用程序，每天在相同的列集（不一定是相同的行值）上运行相同的作业，有没有一种方法可以保存spark执行计划，而不必每次都让spark重新计算它？
我的应用程序需要进行数千次转换，而且构建谱系图和优化计划需要花费大量时间。

来源：https://stackoverflow.com/questions/74537741/is-there-a-way-to-precompile-the-spark-optimization-plan-so-that-it-doesnt-n

1条答案

按热度按时间

是否有一种方法可以保存spark执行计划，而不必每次都让spark重新计算它？
我从来没有遇到过这样的可能性，所以我可以很有信心地说，这不是一个选择。
相反，你可以做什么来优化输入到Spark的数据--优化分区、压缩、支持 predicate 下推的格式，这些可能是你可以节省时间的地方。

赞(0）回复(0）举报 2022-11-25

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 22天前
xxl-job 不能和nacos兼容？
回答(3) 发布于 22天前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 22天前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 22天前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 22天前