ApacheFlink:如何删除select查询中的重复项?

xjreopfe  于 2021-06-24  发布在  Flink
关注(0)|答案(1)|浏览(278)

如何在一个 SELECT 使用apache-fflink进行查询?
我的table是:

我想删除id中的重复项,以保持最大值在范围内

rmbxnbpk

rmbxnbpk1#

假设查询是在静态数据集上运行的,则可以使用常规sql来解决。因为flink实现了标准sql,所以这个查询不是特定于flink的,而是在任何关系数据库系统上运行的。

SELECT DISTINCT t.id, t.name, t.range 
  FROM t, (SELECT id, MAX(range) AS maxRange FROM t GROUP BY id) s
  WHERE t.id = s.id AND t.range = s.maxRange

请注意,如果有一个id的最大范围有多行,则会丢失重复项。

相关问题