我有一个包含400列的csv,其中一些列的值中有“”。例如:
Field_A "123" "" "21111"
我的问题是:在配置单元中创建表时,是否可以自动从数据中删除此引号?或者我需要 regexp_replace() 在每一个领域都要删除?谢谢!
regexp_replace()
7vhp5slm1#
我相信下面来自hortonworks的帖子回答了你的问题。https://community.hortonworks.com/questions/66603/how-to-remove-double-quote-from-csv-file-at-time-o.html
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES ( "separatorChar" = ",", "quoteChar" = "\"" )
1条答案
按热度按时间7vhp5slm1#
我相信下面来自hortonworks的帖子回答了你的问题。https://community.hortonworks.com/questions/66603/how-to-remove-double-quote-from-csv-file-at-time-o.html