hive分区和未分区表运行时和cpu时间

sxpgvts3  于 2021-06-17  发布在  Mysql
关注(0)|答案(0)|浏览(194)

我现在有一张table在下面

create table flights(Year int, Month int, dayOfMonth int, dayOfWeek 
int, depTime int, CRSDepTime int, arrTime int, CRSArrTime int, 
uniqueCarrier string, flightNum int, tailNum int, actualElapsedTime 
int, CRSElapsedTime int, airTime int, arrDelay int, depDelay int, 
origin string, dest string, distance int, taxiIn int, taxiOut int, 
cancelled int, cancellationCode string, diverted int, carrierDelay 
int, weatherDelay int, NASDelay int, securityDelay int, 
lateAircraftDelay int) row format delimited fields terminated by ',';

并且,我使用month列对这个表进行了分区,并比较了cpu时间和占用的总时间。我可以看到,与未分区表相比,分区表的cpu时间显著减少。但是,就所用的总时间而言,两者是相同的。
注:我使用的数据库有22年的所有航班在过去。所以数据量是巨大的。
我想知道为什么cpu时间减少了,总时间还是一样的。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题