如何在pig中将xlsx文件转换为csv文件?

4szc88ey  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(758)

我们怎么能 covert a xlsx 文件到 csv 文件使用pig脚本。我发现有csvexcelstorage来存储alredy转换的xlsx到csv文件。

STORE x INTO '<destFileName>'
USING CSVExcelStorage(['<delimiter>' [,{'YES_MULTILINE' | 'NO_MULTILINE'} [,{'UNIX' | 'WINDOWS' | 'UNCHANGED'}]]]);
Eg:

STORE res INTO '/tmp/result.csv'
USING CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');

我认为在此之前,我们需要将xlsx文件转换成csv。
那我们怎么用Pig来做呢。
任何帮助。

7rfyedvj

7rfyedvj1#

参考:csvexcelstorage
用法:

STORE x INTO '<destFileName>'
USING CSVExcelStorage(['<delimiter>' [,{'YES_MULTILINE' | 'NO_MULTILINE'} [,{'UNIX' | 'WINDOWS' | 'UNCHANGED'}]]]);

如:

STORE res INTO '/tmp/result.csv'
USING CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');

其中crlf是换行符(0x0d 0x0a:\r\n),逗号是字段分隔符。

相关问题