嗨,我对hadoop和pig都是新手。当我尝试在pig中使用order by对数据进行排序时,输出不是完全按升序排列的。输入:1,4,12,36,88,93,7代码:
A = LOAD 'INPUT' using PigStorage();
B = ORDER A BY $0;`enter code here`
DUMP B;
输出:1,12,36,4,7,88,93不正确。请帮我以正确的方式得到它。
嗨,我对hadoop和pig都是新手。当我尝试在pig中使用order by对数据进行排序时,输出不是完全按升序排列的。输入:1,4,12,36,88,93,7代码:
A = LOAD 'INPUT' using PigStorage();
B = ORDER A BY $0;`enter code here`
DUMP B;
输出:1,12,36,4,7,88,93不正确。请帮我以正确的方式得到它。
1条答案
按热度按时间ui7jx7zq1#
您需要将列$0声明为数字,或者使用强制转换。例如:
否则,它本质上是作为字符串处理的。