配置单元中的多行插入

yb3bgrhw  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(372)

我正在尝试通过文件插入配置单元表。但是,文本文件中的最后一列恰好包含跨不同行溢出的数据。
示例数据:

col1|col2|col3|this line is spilling into different line
               as is this, this is spilling this is spilling this is sp
               iliing and so is this
col1|col2|col3|this can be inserted without problem

因此溢出的数据被视为一个新行,而不是 Package 到最后一列中。我尝试使用以option结尾的行,但无法使其工作。

carvr3hs

carvr3hs1#

这是在列中嵌入换行符(行尾/记录)的更一般问题的特例。典型的csv文件格式在字符串字段周围有引号字符,因此通过注意引号内的新行可以简化字段中嵌入新行的检测。您没有引号字符,但知道字段的数量,因此可以检测换行符何时会导致记录过早结束。但是在最后一个字段中检测新行比较困难。需要注意的是,后面的行没有字段分隔符,并且假设下面的行是记录的一部分。

相关问题