我一直在使用sqoop将数据从mysql导入hive,我使用的命令如下:
sqoop import --connect jdbc:mysql://localhost:3306/datasync \
--username root --password 654321 \
--query 'SELECT id,name FROM test WHERE $CONDITIONS' --split-by id \
--hive-import --hive-database default --hive-table a \
--target-dir /tmp/yfr --as-parquetfile
创建了配置单元表并插入了数据,但是我找不到parquet文件。
有人知道吗?
致以最诚挚的问候,
飞然
1条答案
按热度按时间5us2dqdw1#
sqoop导入到配置单元分为两个步骤:
从rdbms到hdfs的数据获取
如果不存在配置单元表,则创建配置单元表并将数据加载到配置单元表中
就你而言,
首先,数据存储在
--target-dir
即。/tmp/yfr
然后,它被加载到hive表中a
使用LOAD DATA INPTH ... INTO TABLE..
命令。正如在注解中提到的,数据被移动到配置单元仓库目录,这就是为什么在这个目录中没有数据
--target-dir
.