我正在尝试使用配置单元生成一些Parquet文件,为了完成此任务,我从一些.tbl文件加载了一个常规配置单元表,通过配置单元中的以下命令:
创建表区域(r\u regionkey bigint、r\u name string、r\u comment string)
以“|”结尾的行格式分隔字段存储为textfile location“/tmp/tpch generate”;
在这之后,我只执行这两行:
创建桌面Parquet地板类区域存储为Parquet地板;
插入Parquet地板区域选择*从区域;
但是当我检查在hdfs中生成的输出时,我没有找到任何.parquet文件,我发现文件名像0000\u0到0000\u21,它们的大小之和比原始tbl文件大得多。
我做错什么了?
1条答案
按热度按时间gab6jxml1#
insert语句不创建扩展名为的文件,但这些是Parquet文件。
你可以用
DESCRIBE FORMATTED <table>
显示表格信息。附加说明:您还可以使用以下查询从源表创建新表:
它将以parquet格式创建新表,并复制结构和数据。