使用hive命令 regexp_extract
我正在尝试更改以下字符串:
201703170455 to 2017-03-17:04:55
发件人:
2017031704555675 to 2017-03-17:04:55.0010
我在SparkyR中这样做是为了使用在r中与gsub一起工作的代码:
newdf<-df%>%mutate(Time1 = regexp_extract(Time, "(....)(..)(..)(..)(..)", "\\1-\\2-\\3:\\4:\\5"))
这个代码是:
newdf<-df%>mutate(TimeTrans = regexp_extract("(....)(..)(..)(..)(..)(....)", "\\1-\\2-\\3:\\4:\\5.\\6"))
但根本不起作用。有没有关于如何使用regexp\u extract的建议?
1条答案
按热度按时间r6hnlfcb1#
apachespark使用java正则表达式方言而不是r,组应该用
$
. 此外regexp_replace
用于通过数字索引提取单个组。你可以用
regexp_replace
: