我正在尝试从talend bigdata studio访问基于区域的hbase表记录。我们是否有任何选项可以根据区域过滤thbaseinput组件中的记录。以及如何过滤thbaseinput中的记录以过滤基于日期列的增量记录?
2ul0zpep1#
据我所知,您不能将hbase扫描限制在特定区域。具体来说,只要rowkey强,salting实现正确,数据分布正确,hbase就能够进行随机读写。按行键筛选速度更快,但按列筛选需要完全扫描,这会降低hbase性能。此外,随着列族中的列越来越多,您将看到性能影响。超过3列家庭它的工作真的很慢。在使用hbase之前,您必须确定您的数据搜索模式。请通过链接了解更多按部分行键筛选hbase扫描hbase中的salting如何扫描salted apache hbase表
1条答案
按热度按时间2ul0zpep1#
据我所知,您不能将hbase扫描限制在特定区域。
具体来说,只要rowkey强,salting实现正确,数据分布正确,hbase就能够进行随机读写。
按行键筛选速度更快,但按列筛选需要完全扫描,这会降低hbase性能。
此外,随着列族中的列越来越多,您将看到性能影响。超过3列家庭它的工作真的很慢。
在使用hbase之前,您必须确定您的数据搜索模式。
请通过链接了解更多
按部分行键筛选hbase扫描
hbase中的salting如何扫描salted apache hbase表