我有一个类似的数据集:
serde位于s3位置的顶部,看起来类似于:
CREATE EXTERNAL TABLE `default.ga_serde_test`(
column1 string,column2 string
)
ROW FORMAT SERDE
'org.apache.hadoop.hive.serde2.OpenCSVSerde'
STORED AS INPUTFORMAT
'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
's3a://xxxxxxx/inbound/xxx'
TBLPROPERTIES (
'COLUMN_STATS_ACCURATE'='false',
'numFiles'='0',
'numRows'='-1',
'quoteChar'='\"',
'rawDataSize'='-1',
'separatorChar'="\000",
'totalSize'='0',
)
我尝试了\000、\0、^@、null作为分隔符或字符-两者都不起作用。数据全部加载到第一列,第二列为空。
有人能建议吗?
暂无答案!
目前还没有任何答案,快来回答吧!