我正在建立一个可行的方法来部署一个mesos/marathon集群(https://github.com/gridpocket/ansible-mesos-cluster).
一旦一切都设置好了,mesos和marathon ui就启动了,但我有两个问题:
-从mesos用户界面我看不到任何奴隶注册
-同一个用户界面还指示“当前没有主控
设置如下:
-3名迈索斯大师(192.168.1.191、192、193):每位跑步迈索斯大师、Zookeeper、马拉松运动员
-3个mesos奴隶(192.168.1.194195196):每个正在运行的mesos奴隶,docker
从属配置
在每个从机中:
/etc/mesos/zk:
zk://192.168.1.191:2181,192.168.1.192:2181,192.168.1.193:2181/mesos
主机配置
在每个主机上:
/etc/mesos/zk:
zk://192.168.1.191:2181,192.168.1.192:2181,192.168.1.193:2181/mesos
/etc/mesos-master/quorum:
2
/etc/mesos-master/hostname and /etc/mesos-master/ip
IP_OF_THE_MASTER
我在配置中遗漏了什么吗?
编辑
我重建了整个集群并更正了zookeeper配置(datadir)。现在,
-mesos主界面正在工作并指示主节点
-marathon ui正在工作
在从机上,mesos从机进程一启动就停止。
关于这个问题,mesos slave日志不是很详细:
Log file created at: 2015/07/09 15:51:15
Running on machine: vagrant-ubuntu-trusty-64
Log line format: [IWEF]mmdd hh:mm:ss.uuuuuu threadid file:line] msg
I0709 15:51:15.487542 8133 logging.cpp:172] INFO level logging started!
I0709 15:51:15.488011 8133 main.cpp:156] Build: 2015-05-05 06:15:50 by root
I0709 15:51:15.488081 8133 main.cpp:158] Version: 0.22.1
I0709 15:51:15.488137 8133 main.cpp:161] Git tag: 0.22.1
I0709 15:51:15.488190 8133 main.cpp:165] Git SHA: d6309f92a7f9af3ab61a878403e3d9c284ea87e0
编辑2
当我手动启动slave时,指示zk字符串,slave将正确启动:
sudo /usr/sbin/mesos-slave --master=zk://192.168.1.191:2181,192.168.1.192:2181,192.168.1.193:2181/mesos
但是“sudo服务mesos slave start”不能启动slave。
编辑3
我在ansible剧本中将状态从“最新”改为“现在”:
- name: install mesos + zookeeper
apt: name=mesos state=present
- name: install marathon
apt: name=marathon state=present
现在一切正常,从机在mesos ui中以激活状态出现。
是因为版本问题吗?
2条答案
按热度按时间idv4meu81#
任何mesos命令行参数都可以设置为
/etc/mesos-slave/master
(用于mesos-slave --master
). 服务启动就是这样查找mesos参数的。你也可以使用
/etc/default/mesos-slave/
(或-master/
)对于环境变量,或/etc/mesos/
一般参数。pxq42qpu2#
在安装mesos时,当我在ansible playbook中使用“present”状态而不是“latest”状态时,可以看到从机在mesos ui中被激活。