我试图将字符串拆分为城市和国家,但当城市或国家超过一个单词时,会遇到困难(例如,aix-en-provence或United States)。我使用的当前代码将适用于大多数像巴黎,法国,但不适用于类似于上述的代码。
locations
paris_france
miami_united states
new york_united states
aix-en-provence_france
auckland_new_zealand
current code used
city = gsub("([A-z]+)_([A-z]+)", "\\1", locations)
country = gsub("([A-z]+)_([A-z]+)", "\\2", locations)
所以现在曼城将回归巴黎,乡村将回归法国,这很好,但奥克兰和新西兰将回归。猜测它显然是一个让它识别“_”之前或之后的多个单词的案例
1条答案
按热度按时间ddrv8njm1#
由于
new_zealand
,我们必须采取一点额外的谨慎。base R
整理
数据