hbase盐析与有效的距离扫描数据检索

mfpqipee  于 2021-06-10  发布在  Hbase
关注(0)|答案(0)|浏览(156)

为了避免hbase中区域服务器的热点,建议避免顺序行键。其中一种方法是对行键的第一个字节进行盐分。我想在我的客户机代码中使用这种技术。
假设我有 n 区域服务器的数量,每个区域服务器最多可容纳 m 区域数。 n*m 就是区域总数。 x ,第一个字节的值为 1 < x <= n*m .
在写路径上,当插入数据时,我会随机生成 x 把它放在我的行键上。这应该有助于均匀分配钥匙。
问题1:我真的应该在制盐策略上更聪明一些吗?
我需要执行范围扫描(时间序列数据)。因为我的数据分散在几个区域,所以我计划并行放置 n*m 扫描请求数。每个线程都将在自己的线程中执行。返回结果后,我将在客户机代码中执行聚合。
问题2:有没有一种方法可以对这些请求进行分组,这样我就可以对每个区域的服务器进行请求,而不是对每个区域进行扫描?
我知道ApachePhoenix也在做类似的事情。但我认为他们是通过协处理器实现的。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题