我有一个架构为-
customer_id string country string start_date string end_date string
我想用结束日期列中的给定字符串替换所有值,该字符串是yyyy mm dd格式,但存储为字符串。通过查看配置单元函数,我发现了其中两个函数:regexp\u replace和translate。参考-配置单元wiki
avwztpqn1#
@bunny:您将无法使用前面提到的udf更新现有列。如果要更新该列,则必须使用update(前提是hive>=0.14,并且表是根据-fileformat-clustering-bucketing创建的)。我肯定你不是在找这种方法!上面提到的两个udf(regexp\u replace和translate)都用于获取所需的输出,但不替换现有数据。我看到的唯一选择是用更新的列覆盖整个表
1条答案
按热度按时间avwztpqn1#
@bunny:您将无法使用前面提到的udf更新现有列。如果要更新该列,则必须使用update(前提是hive>=0.14,并且表是根据-fileformat-clustering-bucketing创建的)。我肯定你不是在找这种方法!
上面提到的两个udf(regexp\u replace和translate)都用于获取所需的输出,但不替换现有数据。
我看到的唯一选择是用更新的列覆盖整个表