我有一个.csv文件,格式是一个(第一个)列/单元格,其中有五个我希望在配置单元表中使用分号分隔的字段;像这样:
ISBN;"Title";"Author";"Year";"Publisher"
0002005018;"Clara Callan";"Richard Bruce Wright";"2001";"HarperFlamingo Canada"
0399135782;"The Kitchen God's Wife";"Amy Tan";"1991";"Putnam Pub Group"
etc.
etc.
...
我是否可以使用配置单元查询来拆分数据;并将其存储在我创建的具有相同列名顺序的表中?
比如regexp\u提取物?或者我需要用serde?
我刚接触hadoop/hive/beeswax,正在使用cloudera快速启动vm5.2
1条答案
按热度按时间mnemlml81#
听起来你想这样做: