这是我的设置-pig-0.10运行模式-本地用户-hadoop有根访问权限
我有一个名为'data'的文件,包含以下内容。1 1 2 3 2 4 5 6 3 7 8 9 4 1 4 7 5 2 5 8
我在-http://pig.apache.org/docs/r0.10.0/basic.html#tuple-模式我试图读取文件,使每一行中的第一个数字被读取为整数,其余3形成一个元组。我使用这个代码-a=load'data'作为(f1:int,f2:tuple(t1:int,t2:int,t3:int));但当我“甩a”时,我得到-(1,)(2,)(3,)(4,)(5,)
它看起来和教程完全一样。但结果却出人意料。我做错什么了?
1条答案
按热度按时间rqdpfwrv1#
我不认为这可以完全在load语句中完成,但是一对语句可以轻松完成。请尝试以下代码:
当我测试这个时,它产生了输出:
(1,(1,2,3))
,这似乎是你的目标。编辑:记住用hdfs中数据的正确文件路径替换“data”