hadoop—在hive中执行加载数据时,它是否复制数据?

qfe3c7zg  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(389)

将存储在hdfs中的数据加载到hive时,hdfs中的数据是否会被复制到hive使用的其他格式中?还是使用原始文件来存储/选择/插入/修改数据?
context:将路径'/home/user/sample.txt'中的数据加载到employee表中;
hive是否总是使用/home/user/sample.txt来存储/选择/插入/修改数据,还是在hdfs/hbase中创建一个新文件来占用新的空间?

a64a0gku

a64a0gku1#

文档中对此进行了解释:
如果未指定关键字local,则配置单元将使用filepath的完整uri(如果已指定),或者将应用以下规则:[…]配置单元将filepath寻址的文件移动到表(或分区)中

zpgglvta

zpgglvta2#

LOAD DATA INPATH 除了将hdfs文件移动到表的位置之外,什么都不做,我所说的“移动”是指hdfs的元数据操作。

相关问题