我正在尝试将表数据从redshift导入hdfs(使用parquet格式),遇到如下错误:
15/06/25 11:05:42 ERROR sqoop.Sqoop: Got exception running Sqoop: java.lang.NullPointerException
java.lang.NullPointerException
at org.apache.sqoop.tool.CodeGenTool.generateORM(CodeGenTool.java:97)
at org.apache.sqoop.tool.ImportTool.importTable(ImportTool.java:478)
at org.apache.sqoop.tool.ImportTool.run(ImportTool.java:605)
at org.apache.sqoop.Sqoop.run(Sqoop.java:143)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70)
at org.apache.sqoop.Sqoop.runSqoop(Sqoop.java:179)
at org.apache.sqoop.Sqoop.runTool(Sqoop.java:218)
at org.apache.sqoop.Sqoop.runTool(Sqoop.java:227)
at org.apache.sqoop.Sqoop.main(Sqoop.java:236)
使用的命令行查询:
sqoop import--driver“com.amazon.redshift.jdbc41.driver”--connectjdbc:postgresql://:5439/events”--用户名“username”--密码“password”--查询“select*from mobile\u og.pages where$conditions”--按匿名\u id拆分--目标dir/user/huser/pq\u mobile\u og\u pages\u 2--作为parquetfile。
它工作的时候很好 --as-parquetfile
选项将从上述命令行查询中删除。
1条答案
按热度按时间6gpjuf901#
这是一个错误sqoop-2571。
如果要导入表的所有数据,则最终可以运行以下命令:
以及
--where
也是一个有用的参数。查看用户手册。