hadoop在pig排序中的应用

hs1ihplo  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(284)

嗨,我对hadoop和pig都是新手。当我尝试在pig中使用order by对数据进行排序时,输出不是完全按升序排列的。输入:1,4,12,36,88,93,7代码:

A = LOAD 'INPUT' using PigStorage();
B = ORDER A BY $0;`enter code here`
DUMP B;

输出:1,12,36,4,7,88,93不正确。请帮我以正确的方式得到它。

ui7jx7zq

ui7jx7zq1#

您需要将列$0声明为数字,或者使用强制转换。例如:

A = LOAD 'INPUT' using PigStorage() AS (a0:int, [extra columns here]);
B = ORDER A BY a0;
DUMP B;

否则,它本质上是作为字符串处理的。

相关问题