我正在尝试将数据从文件移到配置单元表中。文件中的数据看起来像this:-
弦A弦B弦C弦D弦
每个字符串之间用空格隔开。问题是,我希望stringa、stringb和stringc有单独的列,stringd以后有一列,即stringd和stringe应该是同一列的一部分。如果我使用 ROW DELIMITED BY FIELDS TERMINATED BY ' '
,配置单元将为string和stringe生成单独的列(string和stringe本身包含空格,而其他字符串本身不包含空格)
在hive中是否有任何特殊的语法来实现这一点,或者我是否需要以某种方式预处理我的数据文件?
1条答案
按热度按时间ncecgwcz1#
使用正则表达式https://cwiki.apache.org/confluence/display/hive/gettingstarted#gettingstarted-ApachueBlogData您可以定义何时使用空格作为分隔符以及何时使用数据的一部分