我已经刮了一个标题列表,其中一些有字幕。不幸的是,每当有字幕时,它就粘贴到标题上(如paste0()
)。我如何在R中将两者分开?我正在考虑一些regex
,因为模式是CamelCase表示字幕,如下所示:
data <- data.frame(title = "Bilder aus dem LebenWie man Universalerbe wird")
result <- data.frame(title = "Bilder aus dem Leben",
subtitle = "Wie man Universalerbe wird")
3条答案
按热度按时间nbysray51#
一个普通的正则表达式可以查找一个小写字母,然后查找一个大写字母,
ar7v8xwq2#
带tidyr's(新)
separate_wider_regex
:这相当于被取代的
extract
:vcudknz33#
您可以使用
tidyr
中的separate
:sep
在这里使用两个查找来定义拆分点:(?<=[a-z])
:正向后看,Assert在拆分点的左侧必须有小写字母,以及(?=[A-Z])
:Assert拆分点右侧必须有一个大写字母的正向前看