在iaas上下文(实际上是azure)中,我从mesos集群中删除了一台机器,但之前没有安排维护窗口将其拆除。这个代理和属于它的任务现在在我尝试使用的ui上显示为“无法访问” /maintenance/schedule 以及 /machine/down ,但代理和任务仍然在ui上显示为“无法访问”,有什么方法可以摆脱它吗?
/maintenance/schedule
/machine/down
eqfvzcg81#
如何处理这项任务取决于您的框架。mesos本身与不响应healthcheck的代理失去了连接。这导致标记代理及其所有任务无法访问。如果框架是分区感知的,它应该处理这种情况。如果没有,您可能需要等到任务被标记为失败。 --agent_reregister_timeout=VALUE 代理重新注册的超时时间。代理在与主机断开连接或新主机被选为领导时重新注册。在超时时间内未重新注册的代理将在注册表中被标记为不可访问;如果/当代理向主服务器重新注册时,在代理上运行的任何非分区感知任务都将被终止。注意:此值必须至少为10分钟(默认值:10分钟)
--agent_reregister_timeout=VALUE
1条答案
按热度按时间eqfvzcg81#
如何处理这项任务取决于您的框架。mesos本身与不响应healthcheck的代理失去了连接。这导致标记代理及其所有任务无法访问。如果框架是分区感知的,它应该处理这种情况。如果没有,您可能需要等到任务被标记为失败。
--agent_reregister_timeout=VALUE
代理重新注册的超时时间。代理在与主机断开连接或新主机被选为领导时重新注册。在超时时间内未重新注册的代理将在注册表中被标记为不可访问;如果/当代理向主服务器重新注册时,在代理上运行的任何非分区感知任务都将被终止。注意:此值必须至少为10分钟(默认值:10分钟)