在apachepig中,我想将变量中的列序列化为行。更具体地说:
数据,加载到变量中,查看(通过 DUMP
)就像
(val1a, val2a,.... )
(val1b, val2b,val3b,.... )
(val1c, val2c,.... )
.
.
.
我想把它变成
(val1a)
(val2a)
.
.
.
(val1b)
(val2b)
(val3b)
.
.
.
(val1c)
(val2c)
.
.
.
因此,每列都必须“序列化”成行,然后再添加这些行。请注意:我不一定知道每行有多少列。
我怎么能用Pig拉丁语?在python中很容易,但我不知道如何在pig中实现。我尝试了不同的方法 foreach
... generate
构造,但无法使其工作。
1条答案
按热度按时间0vvn1miw1#
展开元组并创建多个元组(每个元组包含一个字段)的一种方法:
注意:您也可以查看这些类似的帖子:
在pig中将一个元组拆分为多个元组
apache pig数据透视表