配置单元sql从多个分区中选择不同的用户id

ma8fv8wu  于 2021-06-26  发布在  Hive
关注(0)|答案(1)|浏览(376)

这是一张 hive 桌

create table user_log (user_id string, visit_tm bigint) partition by(etl_dt string);

etl_dt >= '2018-01-01' and etl_dt <= '2018-01-30'

每个分区都有很多记录,我想从每个分区中选择100个用户id,每个用户id是不同的。如何编写配置单元sql?我需要帮助。谢谢您!

mccptt67

mccptt671#

你能试试这个查询吗:

select DISTINCT user_id from  user_log where etl_dt >= '2018-01-01' limit 100 UNION select DISTINCT user_id from  user_log where etl_dt <= '2018-01-01' limit 100;

希望这有帮助

相关问题