配置单元查询中返回的空行

kognpnkq  于 2021-06-28  发布在  Hive
关注(0)|答案(2)|浏览(414)

我已经从从mongodb导出的tweets json文件创建了一个外部配置单元表。每当我从配置单元表中选择多个列时,检索到的结果的格式就不好。有些列为空或null(即使我以特定值为条件),有些数据出现在错误的列中。
我认为这是因为文本中有逗号。当我尝试在没有选择tweets文本的情况下查询配置单元表时,结果是有意义的。但我不知道怎么解决。
有人知道怎么解决吗??
最好的,

guz6ccqo

guz6ccqo1#

为什么不尝试格式化输出?像这样的-

SELECT
CONCAT(COALESCE(COL1,''),
  '|', COALESCE(COL2,''),
  '|', COALESCE(COL3,''),
  '|', COALESCE(COL4,''),
  '|', COALESCE(COL5,''),
  '|', COALESCE(COL6,''),
  '|', COALESCE(COL7,'')) as tweetsout
FROM (
    SELECT COL1, COL2, COL3, COL4, COL5, COL6, COL7
    FROM TWEETS
    ) TOUT

这将为您提供由管道定义的输出,而不是标准的制表符分隔的输出。

kcrjzv8t

kcrjzv8t2#

不知道确切的数字很难判断 create table 你使用的命令。。。
如果输入数据包含表分隔符,则通常对表的分析不正确。例如,输入数据库中的某些tweet可能包含 \n 它可能是您创建的配置单元表中的行分隔符。

相关问题