配置单元重复数据消除查询

z9gpfhce  于 2021-06-24  发布在  Hive
关注(0)|答案(1)|浏览(342)

正在处理重复数据消除的用例,需要一些指导—单个表包含客户记录及其状态-

用例-
如果一个客户存在多个活动和非活动记录,我们只能提取一个活动记录
如果一个客户存在多个活动记录,我们只能提取一个活动记录
如果一个客户有多条非活动记录,我们只能提取一条非活动记录
我正在尝试与分析功能,但没有运气到目前为止。有什么建议吗。

neekobn8

neekobn81#

使用行数()分析函数:

select customer, status
from
(
select c.*, row_number() over(partition by customer order by status)  rn
  from customer_table c
)s
where rn=1;

相关问题