想知道是否可以跳过中的标题行 org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe 在雅典娜。我试过了 tblproperties ( 'skip.header.line.count' = '1' ) 但不起作用。我认为它可以与opencsvserde一起使用,但它似乎只支持 string 将在查询中完成大量工作的数据类型。
org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe
tblproperties ( 'skip.header.line.count' = '1' )
string
sr4lhrrt1#
我刚刚尝试了以下方法:创建csv并将其上载到s3:
breed_id, breen_name, category 1,pug,toy 2,German Shepard,working, 3,Scottish Terrier,Working
在athena中运行以下ddl:
create external table dogs ( breed_id int, breen_name string, category string ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n' LOCATION 's3://XXXXXXXXXXXXXX/' TBLPROPERTIES ('skip.header.line.count'='1') ;
然后运行以下查询:
SELECT * FROM "default"."dogs" LIMIT 10;
产生以下结果:
1条答案
按热度按时间sr4lhrrt1#
我刚刚尝试了以下方法:
创建csv并将其上载到s3:
在athena中运行以下ddl:
然后运行以下查询:
产生以下结果: