我是sqoop的新手。
我正在运行下面的sqoop命令从oracle表导入数据
sqoop import --connect jdbc:oracle:thin:<username>/<password>@<IP>:1521:MSDP2 --query "select * from table_name where \$CONDITIONS AND created=TRUNC(TO_DATE('20171101','YYYYMMDD'))" --target-dir /stage/ESM/esm_tmp --hive-table ESM_tab --hive-import -m 1
这是使用逗号分隔符创建配置单元表。因为一列包含客户的地址作为其值,所以字段中包含逗号。这导致表中的数据不稳定。
在google中,我发现我们可以使用sqoop命令中的“--fields terminated by”选项来指定所需的分隔符。但是我不知道该把它放在sqoop命令中的什么地方。有人能帮我把命令放在上面sqoop命令的正确位置吗。我喜欢|(管道)分隔符。
2条答案
按热度按时间py49o6xq1#
在sqoop导入之后,您可以在任何地方使用。查询后可以使用的最佳情况
--以“|”结尾的字段
会有用的。请试一试
klh5stk12#
您可以添加
--fields-terminated-by '|'
在命令的任何地方sqoop import
.