带有换行符的用于访问配置单元serde的regex

py49o6xq 于 2021-06-25 发布在 Hive

关注(0)|答案(1)|浏览(465)

CREATE EXTERNAL TABLE ssdm_schema.ABCTable_regex (  
  Data_A VARCHAR(100)  
, Data_B VARCHAR(100)  
, Data_C VARCHAR(100)  
) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe'  
WITH SERDEPROPERTIES (  
"input.regex" = '?????????'  
)

我问这个问题是指下面的答案。
如何处理aws athena中的嵌入换行符
谢谢您

Hive regex hive-serde newline regexserde

来源：https://stackoverflow.com/questions/60049399/regex-for-access-log-in-hive-serde-with-newline

1条答案

按热度按时间

smdncfj31#

解决了。https://regex101.com/r/byf1zm/3 "([\w\s\n\r\X]+?)"\|"([\X\w\s\n\r]+?)"\|"([\X\w\s\n\r]+?)" 与 g 叶和 u 尼科德旗集合。
有三件事让这件事变得棘手：
第2行数据中间的换行符
第2行数据中间的空白
unicode
这个正则表达式可能更简洁，因为匹配模式会重复。

赞(0）回复(0）举报 2021-06-26

我来回答

带有换行符的用于访问配置单元serde的regex

1条答案

相关问题

热门标签

最新问答