我有一个类似于以下的数据集:
identifier number
cat-123 5
green-489743 25
orange-fish5 77
red-blue123 90
dog-23 34
orange5 17
reptile 9
purple-2 11
我需要创建一个新的列“identifier_edited”,其中包含identifier,但不包含任何以破折号开头以数字结尾的结尾。这是我需要的数据看起来像这样的变化:
identifier number identifier_edited
cat-123 5 cat
green-489743 25 green
orange-fish5 77 orange-fish5
red-blue123 90 red-blue123
dog-23 34 dog
orange5 17 orange5
reptile 9 reptile
purple-2 11 purple
请注意,如果结尾不是带数字的破折号(多位数或个位数),则会保留相同的字符串。
我知道如何识别一个以数字结尾的字符串,甚至一个以单破折号和一个数字结尾的字符串,但我不知道如何识别一个以破折号结尾的字符串沿着一个个位数或多位数。
2条答案
按热度按时间fslejnso1#
尝试
sub
模式"-\\d+$"
数据
xesrikrc2#
要识别以破折号结尾的字符串,后跟一个或多个数字,可以使用Regex。