Impala 访问s3中现有的Parquet桌

9cbw7uwe  于 2021-06-26  发布在  Impala
关注(0)|答案(1)|浏览(409)

我有一些Parquet表是用存储在s3中的sparksql创建的。我想也可以使用他们从 Impala 。我还有一个运行在cdh5上的 Impala 示例,我可以使用hue访问它。
从这个impala示例查询上述数据需要做什么?
impala parquet文档似乎主要是关于将数据导入parquet的。我已经有Parquet地板的数据了,我只想让 Impala 看看。我是新的 Impala 和色调,我的经验与Parquet是从sparksql。

n7taea2i

n7taea2i1#

impala实验支持查询存储在s3中的数据。下面是一个例子 CREATE TABLE 使用存储在s3中的Parquet地板数据的语句,取自上一句中链接的文档:

create table sample_data_s3 (id int, id bigint, val int, zerofill
string, name string, assertion boolean, city string, state string)
stored as parquet location 's3a://impala-demo/sample_data';

相关问题