cloudera上的色调-空值(导入文件)

a14dhokn  于 2021-06-26  发布在  Hive
关注(0)|答案(2)|浏览(249)

昨天我安装了cloudera快速启动vm5.8。按色调从数据库导入文件后,某些表中出现空值(整列)。在前面的步骤中,数据正确地显示它们,因为它们应该被导入。
第一张。第二张。

mm9b1k5b

mm9b1k5b1#

一旦检查数据类型的第二(列1)和第三(列2)在原始数据库中从您的导出。这不能是缺少分隔符的情况,否则第四列(第3列)将无法正确填充,这是正确的。

new9mtju

new9mtju2#

你能在hiveshell中运行命令describe formatted table\u name,看看什么是字段分隔符,然后去仓库目录看看数据和表定义中的分隔符是否相同,我确信它不会相同,这就是为什么你会看到null。
我假设您已将数据导入默认仓库目录。
然后你可以做下面的一个
1) 删除配置单元表,并使用正确的分隔符重新创建它,因为它在实际数据中(行格式分隔字段以“your delimiter”结尾,并将位置作为数据文件)

2) 删除导入的数据并再次运行sqoop import,并给出以“配置单元表定义中的定界符”结尾的字段

相关问题