我正在尝试使用sqoop将数据导出到teradata。整个mapreduce.job将完成,但数据未加载,并显示以下内容。
15/07/08 01:27:36 INFO processor.TeradataOutputProcessor: input postprocessor
com.teradata.connector.teradata.processor.TeradataBatchInsertProcessor starts at: 1436333256770
15/07/08 01:27:36 INFO processor.TeradataBatchInsertProcessor: insert from staget table to target table
15/07/08 01:27:36 INFO processor.TeradataBatchInsertProcessor: the insert select sql starts at: 1436333256969
怎么了?
我使用以下脚本加载
sqoop export --connect jdbc:teradata://172.XX.XX.XX/Database=PRD_XXX_XXX \
--connection-manager org.apache.sqoop.teradata.TeradataConnManager \
--username GDW_XYV \
--password 123 \
--export-dir /user/xxxx/xxx_xxx/2001/ \
--table PRD_XXX_XXX.TABLE_T_HD \
--input-fields-terminated-by '|' \
--input-escaped-by '\\' \
--input-enclosed-by '\"' \
--input-optionally-enclosed-by '\"' \
--mapreduce-job-name sq_exp_xxx_xxx_2001 \
--verbose \
-m 20
1条答案
按热度按时间v2g6jxz61#
正如max所说,它正在split.by.partition中创建一个临时stage表。可以在具有访问权限的其他数据库中强制创建stage表,也可以使用split.by.value、split.by.hash或split.by.amp
note:split.by.hash also 如果输入表未分区,则创建分区的暂存表。但是,如果对输入表进行分区,则不会创建额外的stage表。