在我的硕士论文中,我试图在4个节点上建立一个flink独立集群。我已经按照文档进行了工作,文档非常简洁地解释了如何设置它。但是当我启动集群时,会出现一个警告,当我尝试运行作业时,会出现一个错误,并显示相同的消息:
akka.pattern.AskTimeoutException: Ask timed out on [Actor[akka.tcp://flink@MYHOSTNAME:6123/user/jobmanager#-818199108]] after [10000 ms]. Sender[null] sent message of type "org.apache.flink.runtime.messages.JobManagerMessages$LeaderSessionMessage"
增加超时时间不起作用。当我在web ui中打开TaskManager时,它们都具有以下模式:
akka.tcp://flink@MYHOSTNAME:33779/user/taskmanager
有人知道如何解决这个问题以使集群正常工作吗?提前谢谢!
最后一件事:集群上没有用户“flink”,不会被创建。所以没有告诉我任何建议,我应该创建该用户将非常感谢!谢谢!
1条答案
按热度按时间7kqas0il1#
不确定它是否仍然相关,但我的方式(使用flink 1.5.3):
我用以下方式设置了一个ha独立集群,其中有3个主集群(jobmanager)和20个从集群(taskmanager)。
定义conf/masters文件(hostname:8081 per (行)
定义conf/slaves文件(每行的每个taskmanager主机名)
在每台主机上的flink-conf.yaml中定义自己的jobmanager.rpc.address主机名
在每台从机的flink-conf.yaml中,将jobmanager.rpc.address定义为localhost
一旦设置了every,就在任何主主机上执行bin/start-cluster.sh。
如果需要ha,则需要设置zookeeper仲裁并修改有关ha的相应属性(high-availability、high-availability.storagedir、high-availability.zookeeper.quorum)