sqoop将parquet文件导入到target dir,但找不到该文件

yacmzcpb  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(429)

我一直在使用sqoop将数据从mysql导入hive,我使用的命令如下:

sqoop import --connect jdbc:mysql://localhost:3306/datasync \
    --username root --password 654321 \
    --query 'SELECT id,name FROM test WHERE $CONDITIONS' --split-by id \
    --hive-import --hive-database default --hive-table a \
    --target-dir /tmp/yfr --as-parquetfile

创建了配置单元表并插入了数据,但是我找不到parquet文件。
有人知道吗?
致以最诚挚的问候,
飞然

5us2dqdw

5us2dqdw1#

sqoop导入到配置单元分为两个步骤:
从rdbms到hdfs的数据获取
如果不存在配置单元表,则创建配置单元表并将数据加载到配置单元表中
就你而言,
首先,数据存储在 --target-dir 即。 /tmp/yfr 然后,它被加载到hive表中 a 使用 LOAD DATA INPTH ... INTO TABLE.. 命令。
正如在注解中提到的,数据被移动到配置单元仓库目录,这就是为什么在这个目录中没有数据 --target-dir .

相关问题