关闭。这个问题需要更加突出重点。它目前不接受答案。**想改进这个问题吗?**通过编辑这篇文章更新这个问题,使它只关注一个问题。
三年前关门了。改进这个问题它可以在创建表时进行,也可以在使用其他查询(如插入、更新、删除表)时进行。我知道使用bloomfilter这样的选项,blockcache会产生影响。但我想知道其他技术,将提高整体吞吐量。任何人也可以演示如何在hbase表上添加bloomfilter。我想练习一下。感谢您的帮助。
mklgxw1f1#
你的问题太笼统了。为了知道如何在hbase中正确地构建数据存储,您应该了解其存储的内部逻辑以及数据是如何跨区域分布的。这可能是开始的主要地方。我建议您在本文中熟悉lsm树以及hbase如何实现它。在此之后,我建议您阅读关于数据模式的正确设计,因为它将在您的性能中起主要作用。正确的模式和良好的密钥将使您的数据正确地分布在节点上,并将避免出现热点问题。然后你可以开始研究优化技术,比如blume过滤器、块缓存、自定义二级索引和其他东西。
1条答案
按热度按时间mklgxw1f1#
你的问题太笼统了。为了知道如何在hbase中正确地构建数据存储,您应该了解其存储的内部逻辑以及数据是如何跨区域分布的。这可能是开始的主要地方。我建议您在本文中熟悉lsm树以及hbase如何实现它。在此之后,我建议您阅读关于数据模式的正确设计,因为它将在您的性能中起主要作用。正确的模式和良好的密钥将使您的数据正确地分布在节点上,并将避免出现热点问题。然后你可以开始研究优化技术,比如blume过滤器、块缓存、自定义二级索引和其他东西。