我的数据格式是:id,val1,val2
例子
1,0.2,0.1
1,0.1,0.7
1,0.2,0.3
2,0.7,0.9
2,0.2,0.3
2,0.4,0.5
首先我想按val1的降序对每个id进行排序
1,0.2,0.1
1,0.2,0.3
1,0.1,0.7
2,0.7,0.9
2,0.4,0.5
2,0.2,0.3
然后为每个id选择第二个元素id val2组合,例如:
1,0.3
2,0.5
我该如何处理这个问题?
谢谢
我的数据格式是:id,val1,val2
例子
1,0.2,0.1
1,0.1,0.7
1,0.2,0.3
2,0.7,0.9
2,0.2,0.3
2,0.4,0.5
首先我想按val1的降序对每个id进行排序
1,0.2,0.1
1,0.2,0.3
1,0.1,0.7
2,0.7,0.9
2,0.4,0.5
2,0.2,0.3
然后为每个id选择第二个元素id val2组合,例如:
1,0.3
2,0.5
我该如何处理这个问题?
谢谢
2条答案
按热度按时间bfhwhh0e1#
pig是一种脚本语言,不像sql那样是关系语言,它非常适合使用foreach中嵌套了运算符的组。以下是解决方案:
在您的示例中,id1有两行v1==0.2,但v2不同,因此id1的第二个值可以是0.1或0.3
dbf7pr2w2#