如何从一个.csv文件中创建一个配置单元表，该文件有一列，字段用分号表示；

rslzwgfq 于 2021-05-30 发布在 Hadoop

关注(0)|答案(1)|浏览(357)

我有一个.csv文件，格式是一个（第一个）列/单元格，其中有五个我希望在配置单元表中使用分号分隔的字段；像这样：

ISBN;"Title";"Author";"Year";"Publisher"
0002005018;"Clara Callan";"Richard Bruce Wright";"2001";"HarperFlamingo Canada"
0399135782;"The Kitchen God's Wife";"Amy Tan";"1991";"Putnam Pub Group"

etc. 
etc.
...

我是否可以使用配置单元查询来拆分数据；并将其存储在我创建的具有相同列名顺序的表中？
比如regexp\u提取物？或者我需要用serde？
我刚接触hadoop/hive/beeswax，正在使用cloudera快速启动vm5.2

hadoop mysql Hive csv beeswax

来源：https://stackoverflow.com/questions/27616764/how-can-i-make-a-hive-table-from-a-csv-file-which-has-one-column-with-fields-de

1条答案

按热度按时间

mnemlml81#

听起来你想这样做：

CREATE TABLE books (ISBN STRING, Title STRING, Author STRING, Year STRING, Publisher STRING)
  ROW FORMAT DELIMITED FIELDS TERMINATED BY "\;";
LOAD DATA INPATH '/path/to/your/datafile' INTO TABLE books;

赞(0）回复(0）举报 2021-05-30

我来回答

如何从一个.csv文件中创建一个配置单元表，该文件有一列，字段用分号表示；

1条答案

相关问题

热门标签

最新问答