numpy 具有相似字符串的数据框我要将所有相似命名字符串分组

0g0grzrc  于 2023-03-18  发布在  其他
关注(0)|答案(1)|浏览(73)
CardataTransmissions= Cardata.groupby(["Transmission"]).agg(Totalsales=('number', 'sum'))

我已经分组的数据,但它没有分组所有的半自动车在一起,其类似的。

vm0i2vca

vm0i2vca1#

在分组之前,可以将所有出现的Semi...替换为Semi Automatic

Cartada['Transmission'] = (Cartada['Transmission']
          .str.replace(r'^Semi\s*auto.*', 'Semi Automatic', regex=True))

CardataTransmissions = (Cardata.groupby('Transmission')
                               .agg(Totalsales=('number', 'sum')))

输出:

>>> CardataTransmissions
     Transmission  Totalsales
0       Automatic         313
1          Manual         621
2  Semi Automatic          66

相关问题