我已经安装了hadoop和hive。我可以使用配置单元处理和查询xls、tsv文件。我想处理其他文件,如docx,pdf,ppt。我该怎么做?在aws中是否有单独的程序来处理这些文件?请帮帮我。
myzjeezk1#
在hadoop平台中使用这些文件没有任何区别。为了便于访问和持久存储,您可以将这些文件放在s3中。
1条答案
按热度按时间myzjeezk1#
在hadoop平台中使用这些文件没有任何区别。为了便于访问和持久存储,您可以将这些文件放在s3中。