在 textfile
格式,数据以文本格式存储,字段由字段分隔符分隔。这就是为什么我们更喜欢像ctrl^a这样的不可读分隔符。
但在中创建配置单元表时使用字段分隔符有什么影响吗 rcfile
, orc
, avro
& sequencefile
.
在一些配置单元教程中,我也看到了这些二进制文件格式中分隔符的用法。
例子: create table olympic_orcfile(athelete STRING,age INT,country STRING,year STRING,closing STRING,sport STRING,gold INT,silver INT,bronze INT,total INT) row format delimited fields terminated by '\t' stored as orcfile;
在配置单元中,字段分隔符是否被忽略或在二进制文件格式中是否重要?
1条答案
按热度按时间xxe27gdn1#
被rcfile、orc和avro忽略,但对sequencefile很重要。