下推预测在spark中非常重要,但是在任何map或mapPartition操作之后都不起作用?

wwtsj6pe  于 2023-04-12  发布在  Apache
关注(0)|答案(1)|浏览(86)

我试图优化spark应用程序。 predicate 下推对此非常重要。但我发现它在任何map或mapPartition操作后都不起作用。
有人知道如何使spark sql predicate 在map或mapPartition操作后下推工作吗?

9jyewag0

9jyewag01#

PredicatePushdown用于数据跳过--它通过消除不包含搜索值的文件来帮助减少扫描文件的数量。
此机制仅在底层数据扫描期间应用,并且不适用于计算列或生成的行。

相关问题