我尝试用三台机器和下面的主人和奴隶来实现ha。我使用虚拟机的本地测试设置和我的意见如下。
案例1:
m1->领导大师
m2->无引线主,从1
m3->无引线主,从2
案例1.1:当我关闭vmm1机器时,一个非leader变为leading并且能够访问集群,工作正常。
案例1.2:我关闭m2或m3(任何一个非主从vm)。我在m3或m2的网页上看到了这样一条信息:“目前没有大师在领导。”。当我尝试访问m1中的mesos和任何一台可用机器(m2或m3)时。
案例2:
m1->非领导
m2->领导者,奴隶1,
m3->非领导,从属2
案例2.1:当我关闭vmm1机器时,m2中的leader将被保持,集群工作正常。
案例2.2:当我关闭m2(leader with slave)时,集群变得不可用,并在网页上显示错误消息“no master is currently leading”。
案例2.3:当我关闭m3(非领导与从属),集群变得不可用,错误消息“没有主是目前领先的”网页上。
很抱歉,尝试ha只有3台机器和冗长的问题解释。
问题:
同时具有主(引导/非引导)和从(slave)的killing machine是否总是导致集群不可用(案例1.2、2.2、2.3)
我们能用三台像上面那样的机器来实现ha吗,即有三个主设备和两个从设备,主设备和从设备在同一台机器上?
以下是配置。
硕士学位:
m1:mesos master--ip=192.168.1.36--hostname=192.168.1.36--port=6060--quorum=2--cluster=mesoscluster--zk=zk://192.168.1.36:2181192.168.1.42:2181192.168.1.45:2181/mesos--work_dir=/opt/ncms/mesosworkdir/--log_dir=/opt/ncms/mesosworkdir/logs
m2:mesos master--ip=192.168.1.42--hostname=192.168.1.42--port=6060--quorum=2--cluster=mesoscluster--zk=zk://192.168.1.36:2181192.168.1.42:2181192.168.1.45:2181/mesos--work_dir=/opt/ncms/mesosworkdir/--log_dir=/opt/ncms/mesosworkdir/logs
m3:mesos master--ip=192.168.1.45--hostname=192.168.1.45--port=6060--quorum=2--cluster=mesoscluster--zk=zk://192.168.1.36:2181192.168.1.42:2181192.168.1.45:2181/mesos--work_dir=/opt/ncms/mesosworkdir/--log_dir=/opt/ncms/mesosworkdir/logs
奴隶:
m2:mesos slave--ip=192.168.1.42--hostname=192.168.1.42--executor\u registration\u timeout=10min--systemd\u enable\u support=false--master=zk://192.168.1.42:2181192.168.1.45:2181192.168.1.36:2181/mesos--containerizers=mesos,docker
m3:mesos slave--ip=192.168.1.45--hostname=192.168.1.45--executor\u registration\u timeout=10min--systemd\u enable\u support=false--master=zk://192.168.1.42:2181192.168.1.45:2181192.168.1.36:2181/mesos--containerizers=mesos,docker
zookeeper配置:
时间=2000
初始限制=10
同步限制=5
数据目录=/opt/ncms/zkworkdir
客户端端口=2181
服务器1=192.168.1.42:2888:3888服务器3=192.168.1.36:2888:3888
服务器5=192.168.1.45:2888:3888
设置:
主机:windows 7(64gb ram,24核)
虚拟盒:每个虚拟机(m1、m2、m3)有2个内核和2GB ram,RHEL7.2
1条答案
按热度按时间jrcvhitl1#
在您描述的场景中,活动主机的数量低于定额(在您的情况下为2)。这被认为是一种例外情况,某些操作将不会成功,例如,任何修改分布式注册表的操作。