hadoop——sqoop中——连接管理器的意义

gxwragnw  于 2021-05-30  发布在  Hadoop
关注(0)|答案(1)|浏览(370)

我已经编写了sqoop脚本将数据从teradata导入hive。

`sqoop import \
--connect $JDBC_URL \
--driver com.teradata.jdbc.TeraDriver \
--username $Username \
--password $Password \
--table $TD_Table \
--hive-import \
--hive-overwrite \  
--hive-drop-import-delims \
--hive-table $Hive_Database.$Hive_Staging_Table \
--split-by $Split_Col \
-m $Mapper_Number`

上面的脚本发出警告 --connection-manager). Sqoop is going to fall back to org.apache.sqoop.manager.GenericJdbcManager. 但是当我使用上面的脚本--connection manager时,我的--hive drop import delims和--hive overwrite停止工作
我试图了解连接管理器参数的意义,如果我使用它,它将如何影响我的导入
请建议

tez616oj

tez616oj1#

你不需要使用 --driver 上面。另外,请确保已将连接管理器设置为 /etc/sqoop/conf/managers.d . 以下是使其工作的步骤: cd /etc/sqoop/conf mkdir managers.d && cd managers.d echo '<manager factory class> = <manager factory jar>' > td_connector.txt 经理工厂jar应该放进去 /var/lib/sqoop 其中一个可以从cloudera下载。

相关问题