为什么sqoop在从hive导出到mysql的过程中对numeric列的numberformatexception失败

cpjpxq1n 于 2021-06-04 发布在 Hadoop

关注(0)|答案(1)|浏览(453)

我有一个简单的Hive查询

INSERT OVERWRITE DIRECTORY '/tmp/test'
SELECT 
flight,
SUM(CASE WHEN ev=2 THEN 1 ELSE 0 END) AS req 
from data_table
group by flight;

输出看起来像ok（在编辑器中用^a分隔）两个数字列。我已经创建了mysql表

create table hive_table(fl int,evs int);

最后，我想用sqoop将数据从hdfs导出到mysql

sqoop export --connect jdbc:mysql://mysqlhost/dwh --username user --password password --table hive_table --export-dir /tmp/test/ --input-fields-terminated-by "\000" --lines-terminated-by '\n'

但是我得到以下错误（尽管我看到字符串是数值），并且所有导出都失败。我就是不明白为什么？我用的是cloudera cdh3

13/06/02 22:37:17 INFO mapred.JobClient:  map 0% reduce 0%
13/06/02 22:37:22 INFO mapred.JobClient: Task Id : attempt_201304210944_0692_m_000001_0, Status : FAILED
java.lang.NumberFormatException: For input string: "100322836692"
    at java.lang.NumberFormatException.forInputString(NumberFormatException.java:48)
    at java.lang.Integer.parseInt(Integer.java:458)
    at java.lang.Integer.valueOf(Integer.java:554)
    at hive_table.__loadFromFields(hive_table.java:191)
    at hive_table.parse(hive_table.java:143)
    at com.cloudera.sqoop.mapreduce.TextExportMapper.map(TextExportMapper.java:81)
    at com.cloudera.sqoop.mapreduce.TextExportMapper.map(TextExportMapper.java:40)
    at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:144)
    at com.cloudera.sqoop.mapreduce.AutoProgressMapper.run(AutoProgressMapper.java:189)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:647)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:323)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:270)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:396)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformatio

hadoop mysql Hive sqoop

来源：https://stackoverflow.com/questions/16886668/why-sqoop-fails-on-numberformatexception-for-numeric-column-during-the-export-fr

1条答案

按热度按时间

yc0p9oo01#

您需要使用 BIGINT ，因为您的一些输出（如100322836692）太大，无法放入整数（从-2147483648到2147483648），所以当sqoop尝试导入时，它会查看模式，发现您需要一个整数，尝试解析整数，然后由于太大而失败。
这是预期处理大量与Hive时，你正在做 COUNT 或者 SUM 我见过很多次这个错误，它并不总是很明确。
这应该可以解决：

create table hive_table(fl bigint, evs bigint);

赞(0）回复(0）举报 2021-06-04

我来回答

为什么sqoop在从hive导出到mysql的过程中对numeric列的numberformatexception失败

1条答案

相关问题

热门标签

最新问答