昨天我安装了cloudera快速启动vm5.8。按色调从数据库导入文件后,某些表中出现空值(整列)。在前面的步骤中,数据正确地显示它们,因为它们应该被导入。第一张。第二张。
mm9b1k5b1#
一旦检查数据类型的第二(列1)和第三(列2)在原始数据库中从您的导出。这不能是缺少分隔符的情况,否则第四列(第3列)将无法正确填充,这是正确的。
new9mtju2#
你能在hiveshell中运行命令describe formatted table\u name,看看什么是字段分隔符,然后去仓库目录看看数据和表定义中的分隔符是否相同,我确信它不会相同,这就是为什么你会看到null。我假设您已将数据导入默认仓库目录。然后你可以做下面的一个1) 删除配置单元表,并使用正确的分隔符重新创建它,因为它在实际数据中(行格式分隔字段以“your delimiter”结尾,并将位置作为数据文件)或2) 删除导入的数据并再次运行sqoop import,并给出以“配置单元表定义中的定界符”结尾的字段
2条答案
按热度按时间mm9b1k5b1#
一旦检查数据类型的第二(列1)和第三(列2)在原始数据库中从您的导出。这不能是缺少分隔符的情况,否则第四列(第3列)将无法正确填充,这是正确的。
new9mtju2#
你能在hiveshell中运行命令describe formatted table\u name,看看什么是字段分隔符,然后去仓库目录看看数据和表定义中的分隔符是否相同,我确信它不会相同,这就是为什么你会看到null。
我假设您已将数据导入默认仓库目录。
然后你可以做下面的一个
1) 删除配置单元表,并使用正确的分隔符重新创建它,因为它在实际数据中(行格式分隔字段以“your delimiter”结尾,并将位置作为数据文件)
或
2) 删除导入的数据并再次运行sqoop import,并给出以“配置单元表定义中的定界符”结尾的字段