我有一个4节点的集群,配置为1个namenode和3个datanode。我正在执行一个tpch基准测试,我想知道您认为我的集群在不影响查询响应时间的情况下可以处理多少数据。我的硬盘总容量约为700gb,每个节点都有8核的cpu和16gb的ram。我看到我们可以做一些计算来找到容量限制,但我不明白,如果有人能用一种简单的方法解释如何计算集群可以处理的数据量,那将非常有帮助。谢谢您
t9eec4r01#
您可以使用ur集群中70%到80%的空间来存储数据,剩余的空间将用于处理和在ur集群中存储中间结果。这样性能就不会受到影响
3hvapo4f2#
如前所述,您已经配置了4节点集群。您可以去nn webui-->configured capacity部分查看存储详细信息,如果您发现任何困难,请告诉我。
2条答案
按热度按时间t9eec4r01#
您可以使用ur集群中70%到80%的空间来存储数据,剩余的空间将用于处理和在ur集群中存储中间结果。
这样性能就不会受到影响
3hvapo4f2#
如前所述,您已经配置了4节点集群。您可以去nn webui-->configured capacity部分查看存储详细信息,如果您发现任何困难,请告诉我。