此问题已在此处有答案:
How do I extract numbers from the strings in a pandas column of 'object'?(2个答案)
2天前关闭。
我有一个数据框
df
id file
134 file1
2452_1 file2
2233_2 file3
3321 file4
我想创建一个新列,如果id包含“”,则使用id的第一位数,如果不包含“”,则使用整个id:
id file baseid
134 file1 134
2452_1 file2 2452
2233_2 file3 2233
3321 file4 3321
我尝试使用extract,但我不确定我需要的正则表达式。我试过了,但是不管用。对于不包含'_'的id,我没有得到我得到的数字NaN:
df["id"].str.extract(r'([0-9]+)_\d')
1条答案
按热度按时间wfsdck301#
可能的解决方案: