我必须学会使用方法调用somedataset.collect()somedataset.count()在flink工作流的中间应该避免,因为它们会导致代码过早执行。这当然不是你想要的,因为Flink正在采取的懒惰的评估方法。我是否应该避免其他方法调用,因为它们在后台执行executionenvironment.execute()?
6ioyuze21#
有趣的问题,谢谢:)我看了资料来源 .count() 以及 .collect() 呼叫 .execute() . 但是 .print() 以及 .printToErr() (可能还有其他打印方法)调用 .collect() ,因此它们也会触发立即执行。
.count()
.collect()
.execute()
.print()
.printToErr()
1条答案
按热度按时间6ioyuze21#
有趣的问题,谢谢:)
我看了资料来源
.count()
以及.collect()
呼叫.execute()
. 但是.print()
以及.printToErr()
(可能还有其他打印方法)调用.collect()
,因此它们也会触发立即执行。