我试图在集群中的每个cassandra节点开始显示延迟之前,找出它的数据承载能力。基本上,我需要找出什么时候开始向现有集群添加新节点。我指的是这一页。
我们使用具有100g大小的单个数据磁盘的虚拟机。下面是我如何计算每个节点的可用磁盘空间。
原始容量=磁盘大小数据磁盘数量=100克1=100克
格式化磁盘空间=(原始容量0.9)=100克0.9=90克
可用磁盘空间=格式化磁盘空间*(0.5到0.8)=90克*0.5=45克
所以这意味着每个节点可以保存高达45g的数据。这是正确的理解吗?
另外,如果需要与当前数据大小进行比较,是否可以直接与nodetool状态响应进行比较?根据上面的计算,它可以容纳多达45克,而我的集群只能容纳大约11克的数据。我一直在努力通读,但可能是因为我的大脑,我无法理解这一点。
Datacenter: prod_east
=======================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
UN <IP_1> 11.17 GB NO TOKENS ? <token> rack1
UN <IP_2> 12.23 GB NO TOKENS ? <token> rack1
UN <IP_3> 10.72 GB NO TOKENS ? <token> rack1
非常感谢您的帮助。
1条答案
按热度按时间xt0899hw1#
nodetool status load考虑到复制因素,因此每个节点可能拥有100%或更少的数据,如果您的keyspace作为nodetool status命令参数,则尝试添加名称,它将为您提供每个节点拥有的数据。
举个例子:
nodetool状态\u keyspace \u name
数据中心:dc1
状态=上/下|/状态=正常/离开/加入/移动
地址加载令牌拥有主机id机架
un 127.0.0.1 47.66 mb 1 33.3%x机架1
un 127.0.0.2 47.67 mb 1 33.3%x机架1
un 127.0.0.3 47.67 mb 1 33.3%x机架1