mesos框架失效后如何恢复mesos执行器?

jqjz2hbq  于 2021-06-21  发布在  Mesos
关注(0)|答案(1)|浏览(376)

我的设想是,一个框架正在服务器a上运行。它在服务器b上有一个执行器运行一个任务(一个长时间运行、初始化时间长的web服务)。服务器a已关闭。然后在集群中的其他地方重新启动框架。
当前,在重新启动之后,新框架将注册一个运行新任务的新执行器。一段时间后,mesos主程序停用旧的不再运行的框架,这反过来杀死旧的但仍在运行的执行器及其任务。
我希望新的框架重新注册旧的执行者,而不是注册新的执行者。这可能吗?

xesrikrc

xesrikrc1#

mesos论坛上的这篇文章回答了我的问题:
http://www.mail-archive.com/user%40mesos.apache.org/msg00069.html
包括在这里供参考:
(1) 我发现一件特别意外的事情是,如果调度器关闭,那么执行器将关闭。当调度程序关闭时,是否有办法保持执行者/任务运行?我可以想象,当调度器返回时,它可以以某种方式重新建立状态,并在不中断正在运行的任务的情况下继续运行。这是为mesos设计的用例吗?
您可以使用frameworkinfo.u timeout来告诉mesos框架在清理框架的执行器和任务之前需要等待多长时间才能重新注册。
另外,请注意,要使其工作,框架必须在第一次向主服务器注册时保持其frameworkid。当框架恢复时,它需要通过设置frameworkinfo.framework\u id=persistend id来重新连接。

相关问题