我在配置单元中有一个托管表,我想基于它的一列对其进行分区。有没有一种简单的方法可以从这个托管表创建分区表?托管表a(s、d、f、g、h、j、k、键)将表b创建为按键分区的表a。谢谢
o0lyfsai1#
您可以通过动态分区来实现这一点:下面是一个示例:我有一些日志数据,其中包含字段id,tdate,info我已经创建了一个动态分区表
CREATE TABLE log_partitioned(id STRING, info STRING) PARTITIONED BY ( tdate STRING)
然后加载数据
FROM logs lg INSERT OVERWRITE TABLE log_partitioned PARTITION(tdate) SELECT lg.id, lg.info, lg.tdate DISTRIBUTE BY tdate;
它将通过动态分区从托管表成功加载数据。我发现这个教程非常有用。请参考此“http://kickstarthadoop.blogspot.com/2011/06/how-to-speed-up-your-hive-queries-in.html"
1条答案
按热度按时间o0lyfsai1#
您可以通过动态分区来实现这一点:
下面是一个示例:我有一些日志数据,其中包含字段
id,tdate,info我已经创建了一个动态分区表
然后加载数据
它将通过动态分区从托管表成功加载数据。
我发现这个教程非常有用。请参考此“http://kickstarthadoop.blogspot.com/2011/06/how-to-speed-up-your-hive-queries-in.html"