我有包含名称的列。我希望删除名称和;其中在名称后标记为(Retired)或(Retired)。但问题是,它不会以相同的格式显示。有时单元格有多个名称,其中一个名称会被重试。在另一种情况下,单元格的名字后面是Retired,然后是姓氏。
Dataframe = df
示例列值-当前状态
Owner Name
George (Georgy) (Retired) Clooney
Meghan (retired) Markle
Harry Porter (Retired)
Hermione Granger; Harry Porter (Retired)
Ginny Weasley; Ron Weasley; Harry Porter (retired); Luna Lovegood
示例列值-未来状态
Owner Name
Null
Null
Null
Hermione Granger
Ginny Weasley; Ron Weasley; Luna Lovegood
我想用“”替换,但不起作用。请。我将不胜感激任何指示。
2条答案
按热度按时间ao218c7q1#
split
,筛选,再次与groupby.agg
连接:输出:
vwkv1x7d2#
使用单个正则表达式替换:
执行时间比较(仅针对用例):