在配置单元中二进制文件格式中字段分隔符重要吗?

bqf10yzr  于 2021-06-01  发布在  Hadoop
关注(0)|答案(1)|浏览(329)

textfile 格式,数据以文本格式存储,字段由字段分隔符分隔。这就是为什么我们更喜欢像ctrl^a这样的不可读分隔符。
但在中创建配置单元表时使用字段分隔符有什么影响吗 rcfile , orc , avro & sequencefile .
在一些配置单元教程中,我也看到了这些二进制文件格式中分隔符的用法。
例子: create table olympic_orcfile(athelete STRING,age INT,country STRING,year STRING,closing STRING,sport STRING,gold INT,silver INT,bronze INT,total INT) row format delimited fields terminated by '\t' stored as orcfile; 在配置单元中,字段分隔符是否被忽略或在二进制文件格式中是否重要?

xxe27gdn

xxe27gdn1#

被rcfile、orc和avro忽略,但对sequencefile很重要。

相关问题