我不太清楚这个问题该怎么说,所以如果有更好的地方可以回答这个问题的话,请重新引导我。
现在我有一个数据结构,或多或少是这样组织的:
我希望我的数据如下所示:
对不起,这些图片,显然我不能用markdown来制作!
我意识到我的问题类似于这个问题,但理想情况下我希望能够在pig中做到这一点,但知道如何在hive、r、python或excel/librecalc中做到这一点也会很有用/有趣。
我甚至不知道这种数据操作叫什么,所以把我引向某种通用的wiki页面会很有帮助。
我不太清楚这个问题该怎么说,所以如果有更好的地方可以回答这个问题的话,请重新引导我。
现在我有一个数据结构,或多或少是这样组织的:
我希望我的数据如下所示:
对不起,这些图片,显然我不能用markdown来制作!
我意识到我的问题类似于这个问题,但理想情况下我希望能够在pig中做到这一点,但知道如何在hive、r、python或excel/librecalc中做到这一点也会很有用/有趣。
我甚至不知道这种数据操作叫什么,所以把我引向某种通用的wiki页面会很有帮助。
2条答案
按热度按时间elcex8rz1#
我不确定这在Hive里能不能用。我知道它和sql非常相似。试试看。
bqf10yzr2#
@vkp让我朝着正确的方向开始,但我不得不添加一些调整,使它在hive上工作:
仍然有兴趣的解决方案,工作在Pig。