我有一个包含两列的表,name和value。我想计算每个组合在Hive中重复的次数
Alex Biology
Joe Chemistry
Alex Physics
Alex Physics
Joe Physics
Joe Physics
我希望输出像
Alex Biology 1
Joe Chemistry 1
Alex Physics 2
Joe Physics 2
我尝试了一个类似sql的count查询,从tbl中选择不同的名称、值、count(*),但是失败了,出现了一个错误“not yet supported place for udaf count”,我尝试使用collect\u set,但也没有成功
select x.name, x.value
, num_arr
from (
select *
, count(collect_set(name) over (partition by value)) num_arr
from count_unique ) x
1条答案
按热度按时间ajsxfq5m1#
你可以用简单的
group_by
函数并计算组合。试试这个