我已经编写了sqoop脚本将数据从teradata导入hive。
`sqoop import \
--connect $JDBC_URL \
--driver com.teradata.jdbc.TeraDriver \
--username $Username \
--password $Password \
--table $TD_Table \
--hive-import \
--hive-overwrite \
--hive-drop-import-delims \
--hive-table $Hive_Database.$Hive_Staging_Table \
--split-by $Split_Col \
-m $Mapper_Number`
上面的脚本发出警告 --connection-manager). Sqoop is going to fall back to org.apache.sqoop.manager.GenericJdbcManager.
但是当我使用上面的脚本--connection manager时,我的--hive drop import delims和--hive overwrite停止工作
我试图了解连接管理器参数的意义,如果我使用它,它将如何影响我的导入
请建议
1条答案
按热度按时间tez616oj1#
你不需要使用
--driver
上面。另外,请确保已将连接管理器设置为/etc/sqoop/conf/managers.d
. 以下是使其工作的步骤:cd /etc/sqoop/conf
mkdir managers.d && cd managers.decho '<manager factory class> = <manager factory jar>' > td_connector.txt
经理工厂jar应该放进去/var/lib/sqoop
其中一个可以从cloudera下载。