我有一个数据集,其中的名称输入不同。一些名称被输入为名字空间的姓氏,而其他名称被输入为姓氏逗号名字。我需要所有读取姓氏逗号名字。我想保留 Dataframe 内的数据,但如果没有其他方法可以这样做,我可以追加回来。以下是 Dataframe 的一个示例:
| 姓名|其他栏(_C)|
| - -|- -|
| 约翰·史密斯|一个人。|
| 山姆·米勒|一个人。|
| 安德森|一个人。|
| 威廉姆斯|一个人。|
| 苏珊·斯泰尔斯|一个人。|
| 大卫|一个人。|
我试过在 Dataframe 中使用管道后执行case_when语句,但没有成功。我也试过grep 1和str_split。
3条答案
按热度按时间nlejzf6q1#
正则表达式:
如果有逗号,则不会改变任何内容。如果没有逗号,则会使用最后一个“单词”(以空格分隔),并将其移动到前面并加上逗号。
数据类型
20jt8wwn2#
您还可以执行以下操作。
数据类型
5cg8jx4n3#
这可能有助于您: