我需要获取示例数据的用户/集的总观看时间。
user_id,episode_name,start_time,end_time
101,Movie1,1,10
101,Movie1,5,15
101,Movie1,18,23
102,Movie1,1,10
102,Movie1,5,15
102,Movie1,18,23
方法是将开始时间和结束时间作为一个范围,然后使用explode。但它不起作用。
Expected Solution:
user_id,episode_name,total_hours
101,Movie1,19
102,Movie1,19
1条答案
按热度按时间d5vmydt91#
这是一种群岛问题。我将建议一个累积最大值方法来确定这些岛屿的起点。这样做的目的是确定岛屿,然后总结其价值:
要获得总数,可以使用附加的聚合级别: