这是一张 hive 桌
create table user_log (user_id string, visit_tm bigint) partition by(etl_dt string); etl_dt >= '2018-01-01' and etl_dt <= '2018-01-30'
每个分区都有很多记录,我想从每个分区中选择100个用户id,每个用户id是不同的。如何编写配置单元sql?我需要帮助。谢谢您!
mccptt671#
你能试试这个查询吗:
select DISTINCT user_id from user_log where etl_dt >= '2018-01-01' limit 100 UNION select DISTINCT user_id from user_log where etl_dt <= '2018-01-01' limit 100;
希望这有帮助
1条答案
按热度按时间mccptt671#
你能试试这个查询吗:
希望这有帮助