我的数据框中有一列包含数字和文本字符串,例如:
0 200 to 500 people
1 1 to 5 people
2 5000 people and over
3 2000 to 3000 people
字符串
我想把这些字符串都转换成一个数字。对于那些有范围的,我们可以考虑范围的平均值,对于那些只包含一个数字的,我们可以提取相同的数字。所以我的结果应该是:
0 350
1 3
2 5000
3 2500
型
如果你能给予我一点提示,告诉我怎么做,我将不胜感激。我知道如何使用正则表达式来得到数字,但在这里我不知道如何对包含两个数字的行求平均值,同时得到包含一个数字的行的唯一数字。
1条答案
按热度按时间n3ipq98p1#
假定字符串值存储在
s
列中,字符串
然后:
型