以“\u0000”作为分隔符的配置单元serde-无法使其工作

u5rb5r59  于 2021-05-31  发布在  Hadoop
关注(0)|答案(0)|浏览(413)

我有一个类似的数据集:

serde位于s3位置的顶部,看起来类似于:

CREATE EXTERNAL     TABLE `default.ga_serde_test`(  
column1 string,column2 string
)   
ROW FORMAT SERDE    
'org.apache.hadoop.hive.serde2.OpenCSVSerde'    
 STORED AS INPUTFORMAT  
'org.apache.hadoop.mapred.TextInputFormat'  
 OUTPUTFORMAT   
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'    
 LOCATION   
's3a://xxxxxxx/inbound/xxx'
 TBLPROPERTIES (    
'COLUMN_STATS_ACCURATE'='false',    
'numFiles'='0',     
'numRows'='-1',     
'quoteChar'='\"',   
'rawDataSize'='-1',     
'separatorChar'="\000",     
'totalSize'='0',    
 )

我尝试了\000、\0、^@、null作为分隔符或字符-两者都不起作用。数据全部加载到第一列,第二列为空。
有人能建议吗?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题