何时在配置单元表上创建bloom过滤器?

vshtjzan  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(494)

我在4个不同的列上创建了一个包含bloom过滤器的配置单元表,然后决定使用alter命令添加更多的配置单元表。
但我不确定如何刷新/重新生成配置单元上的bloom筛选器。
在插入数据期间是否创建了bloom过滤器?
它是在我们收集数据时创建的吗?列级还是表级?
或者我完全偏离了我对布鲁姆过滤器的理解,它是在飞行中创造的?
我已经阅读了文档,还没有找到更多关于这个的信息。尝试在没有运气的情况下遍历代码并找到触发方法的位置。

6rqinv9w

6rqinv9w1#

您可以使用analyze table命令update statistics在配置单元0.10.0及更高版本中执行此操作。
例如。

ANALYZE TABLE Table1 COMPUTE STATISTICS FOR COLUMNS;

注意:bloom过滤器是在插入数据时创建的

ddhy6vgd

ddhy6vgd2#

在插入数据期间是否创建了bloom过滤器?
对。当我们向表中插入行时,orc文件中的bloom过滤器和索引数据是逐条创建的。为了提高查询效率,建议在插入数据之前对相应的列进行排序。
它是在我们收集数据时创建的吗?列级还是表级?
否。如果向bloom筛选器列表中添加了新列,则应重新插入表数据。

相关问题