我需要用flink来分割数据流。
第一个名为“myds”的文件包含重复的数据
第二个名为“gooddatastream”的应该过滤重复项
部分代码为:
goodDataStream = myDs
.filter( new DedupeFilterFunction()) // does this line affects myDs also?
// createSync for goodDataStream
// createSync for myDs
我的问题是:
这是否意味着myds sync还包括新的deduplefilterfunction()
谢谢。
1条答案
按热度按时间oiopk7p51#
DataStream
是不变的。对你来说myDs
不会有DedupeFilterFunction
应用。