假设我有以日期和小时标记的数据。我想收集两年的数据。然后我想做同样的聚合,但是间隔增加了1个小时。所以我有一个1年的滑动窗口,每次移动1小时。这意味着每次我处理数据时,所有的数据都是相同的,只是最近一个小时的数据被遗漏了,最近一个小时有新的数据。但这是对历史数据的分析,所以我现在已经有了所有的数据。
我的问题是在这种情况下我可以使用流式api吗?我想这样做的原因是,我希望有一些性能优化的滑动窗口。从理论上讲,不必重新处理滑动窗口中间的所有数据,聚合只需查看滑动窗口末端的更改即可更新。这有可能吗?我以前没有使用过流式api,所以我确信这是正确的。
暂无答案!
目前还没有任何答案,快来回答吧!