我是从csv文件和数据是由空间分隔加载。在将数据加载到最终表之后,它正在加载额外的空值,这些空值是一个额外的行以及实际数据。
实际数据
id first_name last_name email gender ip_address
1 James Coleman jcoleman0@cam.ac.uk Male 136.90.241.52
2 Lillian Lawrence llawrence1@statcounter.com Female 101.177.15.130
3 Theresa Hall thall2@sohu.com Female 114.123.153.64
4 Samuel Tucker stucker3@sun.com Male 89.60.227.31
5 Emily Dixon edixon4@surveymonkey.com Female 119.92.21.19
表格创建
create table serde_sample(id int,first_name string,last_name string,email string,gender string,ip_address string)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
with serdeproperties (
"separatorChar" = "\t"
)
tblproperties('skip.header.line.count'='1')
;
LOAD DATA LOCAL INPATH '/home/cloudera/Desktop/files/serde.csv' into table serde_sample;
有输出吗
NULL NULL NULL NULL NULL NULL
1 James Coleman jcoleman0@cam.ac.uk Male 136.90.241.52
NULL NULL NULL NULL NULL
NULL NULL NULL NULL NULL NULL
2 Lillian Lawrence llawrence1@statcounter.com Female 101.177.15.130
NULL NULL NULL NULL NULL
NULL NULL NULL NULL NULL NULL
3 Theresa Hall thall2@sohu.com Female 114.123.153.64
NULL NULL NULL NULL NULL
NULL NULL NULL NULL NULL NULL
4 Samuel Tucker stucker3@sun.com Male 89.60.227.31
NULL NULL NULL NULL NULL
NULL NULL NULL NULL NULL NULL
5 Emily Dixon edixon4@surveymonkey.com Female 119.92.21.19
NULL NULL NULL NULL NULL
NULL NULL NULL NULL NULL NULL
我不知道哪里出了问题。为什么会有多余的空行。有人能帮忙解决这个问题吗
暂无答案!
目前还没有任何答案,快来回答吧!