我最近被介绍给 Spark-SQL
试着把我的头绕过去。我期待着学习最佳实践,技巧和技巧,用于优化sparksql查询。最重要的是,我想学习口译 Spark SQL
解释计划。我在网上搜索过关于 Spark SQL
解释一下,结果几乎什么都没有。
谁能帮帮我,把我引向正确的方向吗。
由于spark的体系结构与传统rdbms不同,有许多关系优化选项不适用于spark(例如利用索引等)。我找不到许多专门与sparksql相关的资源。我希望学习最好的技巧/技巧(例如,提示的使用,连接子句中表的顺序,即在连接条件的末尾保持最大的表等),以便为 Spark-SQL
.
最重要的是,了解和利用
Spark-SQL Explain Plans
会很棒的。但是,请注意,我只能访问sparksql,而不能访问pysparksql。
感谢您的帮助。
谢谢
暂无答案!
目前还没有任何答案,快来回答吧!