hbase中有哪些性能改进技术?

trnvg8h3  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(312)

关闭。这个问题需要更加突出重点。它目前不接受答案。
**想改进这个问题吗?**通过编辑这篇文章更新这个问题,使它只关注一个问题。

三年前关门了。
改进这个问题
它可以在创建表时进行,也可以在使用其他查询(如插入、更新、删除表)时进行。我知道使用bloomfilter这样的选项,blockcache会产生影响。但我想知道其他技术,将提高整体吞吐量。任何人也可以演示如何在hbase表上添加bloomfilter。我想练习一下。
感谢您的帮助。

mklgxw1f

mklgxw1f1#

你的问题太笼统了。为了知道如何在hbase中正确地构建数据存储,您应该了解其存储的内部逻辑以及数据是如何跨区域分布的。这可能是开始的主要地方。我建议您在本文中熟悉lsm树以及hbase如何实现它。在此之后,我建议您阅读关于数据模式的正确设计,因为它将在您的性能中起主要作用。正确的模式和良好的密钥将使您的数据正确地分布在节点上,并将避免出现热点问题。然后你可以开始研究优化技术,比如blume过滤器、块缓存、自定义二级索引和其他东西。

相关问题