我有一个管道,它使用以下形状的数据: case class Foo(source: String, destination: String){def key=source+destination}
我要删除所有 source+destination
在同一小时内到达的重复呼叫,然后我要统计在同一小时内到达目的地的所有呼叫。我用一个 src ~> timewindow1(1 hour, keyBy:key) ~> timewindow2(1 hour, keyBy:destination) ~> ...
我应该用吗 timewindowAll
在时间窗口2中?
1条答案
按热度按时间gtlvzcf81#
你应该只使用
timeWindowAll
在您不希望使用键分区窗口的情况下。因为您是按目的地键入,所以应该使用timeWindow
,不是timeWindowAll
.