将存储在hdfs中的数据加载到hive时,hdfs中的数据是否会被复制到hive使用的其他格式中?还是使用原始文件来存储/选择/插入/修改数据?context:将路径'/home/user/sample.txt'中的数据加载到employee表中;hive是否总是使用/home/user/sample.txt来存储/选择/插入/修改数据,还是在hdfs/hbase中创建一个新文件来占用新的空间?
a64a0gku1#
文档中对此进行了解释:如果未指定关键字local,则配置单元将使用filepath的完整uri(如果已指定),或者将应用以下规则:[…]配置单元将filepath寻址的文件移动到表(或分区)中
zpgglvta2#
LOAD DATA INPATH 除了将hdfs文件移动到表的位置之外,什么都不做,我所说的“移动”是指hdfs的元数据操作。
LOAD DATA INPATH
2条答案
按热度按时间a64a0gku1#
文档中对此进行了解释:
如果未指定关键字local,则配置单元将使用filepath的完整uri(如果已指定),或者将应用以下规则:[…]配置单元将filepath寻址的文件移动到表(或分区)中
zpgglvta2#
LOAD DATA INPATH
除了将hdfs文件移动到表的位置之外,什么都不做,我所说的“移动”是指hdfs的元数据操作。