我试图创建一个逻辑,使用Apache Hive或Spark SQL使用相邻行中的数据进行重新计算,但我不确定如何实现,所以我问了一个问题。
12
11 1
10 2
9 3
8 4
7 5
6
hh val
1 5
2 4
3 3
4 2
5 1
6 5
7 4
8 3
9 2
10 1
11 5
12 4
重新计算逻辑为:将两个相邻时区的值相加。通过将10点处的1、11点处的5、1点处的5和2点处的4相加到12点处的4,将12点重新计算为19。
用程序语言做起来似乎很简单,但用SQL表达起来却很困难,如果有人知道怎么做,请帮忙。
它不能表示为一个简单的聚合函数(sum)
1条答案
按热度按时间v8wbuo2f1#
我不确定我是否正确理解了你的要求,但是你可以考虑使用窗口函数
将两个相邻时区的值相加。