hadoop中的不同文件进程

liwlm1x9  于 2021-05-30  发布在  Hadoop
关注(0)|答案(1)|浏览(242)

我已经安装了hadoop和hive。我可以使用配置单元处理和查询xls、tsv文件。我想处理其他文件,如docx,pdf,ppt。我该怎么做?在aws中是否有单独的程序来处理这些文件?请帮帮我。

myzjeezk

myzjeezk1#

在hadoop平台中使用这些文件没有任何区别。为了便于访问和持久存储,您可以将这些文件放在s3中。

相关问题