我用中间层的云形成模板建立了一个中间层星团。集群启动后一切正常。
我最近注意到mesos Jmeter 板中没有列出任何从属节点。ec2控制台显示从机正在运行并通过健康检查。我重新启动了集群上的节点,但没用。我进入其中一个从服务器,注意到mesos从服务器服务没有运行。执行 sudo systemctl status dcos-mesos-slave.service
但这无法启动服务。
往里看 /var/log/mesos/
以及 tail -f mesos-slave..invalid-user.log.ERROR.20151127-051324.31267
看到下面的。。。 F1127 05:13:24.242182 31270 slave.cpp:4079] CHECK_SOME(state::checkpoint(path, bootId.get())): Failed to create temporary file: No space left on device
但是 df -h
以及 free
显示有足够的磁盘空间。
这让我想知道,为什么它抱怨没有磁盘空间?
2条答案
按热度按时间s2j5cfk01#
跑步是个好习惯
这样,您将通过删除未使用的docker图像来释放空间
ffvjumwh2#
好吧,我想出来了。
当长时间运行或频繁负载时
/tmp
由于mesos使用/tmp/mesos/
作为工作指导。你看,文件系统只能保存一定数量的文件引用(inode)。在我的例子中,奴隶们从图像拉入中收集了大量的文件/var/lib/docker/tmp
.要解决此问题:
1) 删除下的文件
/tmp
2) 设置其他工作目录位置