如何使用ApacheFlink的taskmangers实现容错(恢复)?

qyswt5oh  于 2021-06-25  发布在  Flink
关注(0)|答案(1)|浏览(244)

jobmanager的恢复是使用zookeeper实现的,但是如果taskmanager失败了怎么办?如何从中恢复,jobmanager是否自动恢复TaskManager?

q1qsirdb

q1qsirdb1#

通常,jobmanager会注意从taskmanager故障中恢复。如何做到这一点取决于您的设置。
如果在yarn上运行flink,jobmanager将在意识到taskmanager已死亡并重新分配任务时启动新的taskmanager。
如果在集群上独立运行flink,则必须确保运行一个(或多个)备用taskmanager。jobmanager将故障tm的任务分配给备用tm。这也意味着您必须确保有足够的备用tms启动并运行。

相关问题