改造pig拉丁语结果

icnyk63a  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(334)

我想改变你的结果。
用一些Pig拉丁语,比如说“dump table1”,给我以下结果。
(测试1,1.0,link1,link2,link3)哪个'\t'存在于link1,link2,link3之间。
我想把结果改成
(测试1,链接1)
(测试1,链接2)
(测试1,链接3)
有人知道我怎么做这个吗?
提前谢谢。

hlswsv35

hlswsv351#

你可以用 TOKENIZE 内置的自定义项,它将在字符串中为您提供一包不同的令牌。如果您仅有的非字母数字字符是tab,那么就可以了。只是 FLATTEN 得到的包和您将有不同的令牌在不同的行中,就像您想要的。
如果您的字符串比您显示的更复杂,并且您需要精确控制如何拆分它们,那么可以使用 STRSPLIT ,但这将返回一个元组,因此您需要在 FLATTEN 惯性导航与制导。

相关问题