中间层从属节点无法重新启动

30byixjq  于 2021-06-21  发布在  Mesos
关注(0)|答案(2)|浏览(383)

我用中间层的云形成模板建立了一个中间层星团。集群启动后一切正常。
我最近注意到mesos Jmeter 板中没有列出任何从属节点。ec2控制台显示从机正在运行并通过健康检查。我重新启动了集群上的节点,但没用。我进入其中一个从服务器,注意到mesos从服务器服务没有运行。执行 sudo systemctl status dcos-mesos-slave.service 但这无法启动服务。
往里看 /var/log/mesos/ 以及 tail -f mesos-slave..invalid-user.log.ERROR.20151127-051324.31267 看到下面的。。。 F1127 05:13:24.242182 31270 slave.cpp:4079] CHECK_SOME(state::checkpoint(path, bootId.get())): Failed to create temporary file: No space left on device 但是 df -h 以及 free 显示有足够的磁盘空间。
这让我想知道,为什么它抱怨没有磁盘空间?

s2j5cfk0

s2j5cfk01#

跑步是个好习惯

docker rmi -f $(docker images | grep "<none>" | awk "{print \$3}")

这样,您将通过删除未使用的docker图像来释放空间

ffvjumwh

ffvjumwh2#

好吧,我想出来了。
当长时间运行或频繁负载时 /tmp 由于mesos使用 /tmp/mesos/ 作为工作指导。你看,文件系统只能保存一定数量的文件引用(inode)。在我的例子中,奴隶们从图像拉入中收集了大量的文件 /var/lib/docker/tmp .
要解决此问题:
1) 删除下的文件 /tmp 2) 设置其他工作目录位置

相关问题