rdbms—hive中的“分区”功能是什么?我应该在这里做什么?

huus2vyu  于 2021-06-27  发布在  Hive
关注(0)|答案(1)|浏览(293)

我有一个包含以下列的文件,要求我“基于提取日期进行分区”提取日期”是文件中的一列。以下是文件中的列:
提取日期
名称
位置
提取日期
现在,我的unix目录中包含了这个文件。
我到底被要求在这里做什么?

czq61nw1

czq61nw11#

分区是配置单元中的一个特性,它以表中的一组记录为目标。
首先,根据“extract date”列创建一个分区表,如下所示

create table <table_name> 
(
name string,
location string
)
partitioned by (extract_date string)
stored as TEXTFILE;

通过这样做,将创建分区表。
现在,为了将数据从一个文件加载到您的表中,有很多方法可以这样做,
使用静态分区机制加载
通过从另一个表中选择数据等,使用动态分区加载。

相关问题