将分区orc数据文件复制到另一个外部分区orc表

ghhkc1vu  于 2021-06-02  发布在  Hadoop
关注(0)|答案(0)|浏览(250)

问题:将带有orc文件的分区文件夹复制到另一个外部分区orc表后,行计数不正确
我在dev模式中有这个employee表。此表是外部分区orc表。
创建外部表dev.employee(empid string,empname string,update \u gmt \u ts timestamp),由(partition \u upd \u gmt \u ts string)分区,存储为orc位置'/dev/employee';
我在这些分区文件夹中有orc数据文件。
hdfs dfs-ls/开发人员/员工
drwxr-xr-x-user1 group1 0 2017-02-08 10:25/dev/employee/partition\u upd\u gmt\u ts=201609 drwxr-xr-x-user1 group1 0 2017-02-08 10:24/dev/employee/partition\u upd\u gmt\u ts=201610
当我执行这个查询时
从dev.employee中选择count(),其中1=1;
1000—正确的行数
我在prod schema中有employee表的另一个表副本。这也是一个外部分区orc表。我还想将相同的数据推入该表。
创建外部表prod.employee(empid string,empname string,update \u gmt \u ts timestamp),由(partition \u upd \u gmt \u ts string)分区,存储为orc location'/prod/employee';
所以我做了一份hdfs拷贝
hdfs dfs-cp/dev/employee/
/prod/employee/
数据被复制了。
hdfs dfs-ls/产品/员工
drwxr-xr-x-user1 group1 0 2017-02-08 10:25/prod/employee/partition\u upd\u gmt\u ts=201609 drwxr-xr-x-user1 group1 0 2017-02-08 10:24/prod/employee/partition\u upd\u gmt\u ts=201610
但当我执行count查询时,得到的行数为零。
你能帮我解释一下为什么我没有得到和行数一样的1000吗。
从prod.employee中选择count(*),其中1=1;
0—行数错误

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题