如果前缀相似,我希望通过几个列进行分组,并根据一列内的分类值进行求和。
数据
name type size month
AA:3400 5 august
AA:3401 FALSE 1 august
AA:3402 FALSE 2 august
AA:3404 TRUE 0 august
AA:3409 FALSE 1 september
AA:3410 FALSE 8 september
AA:3412 FALSE 9 september
BB:3400 TRUE 4 august
BB:3401 FALSE 7 august
字符串
所需
name type size month
AA TRUE 0 august
AA FALSE 3 august
AA 5 august
BB TRUE 4 august
BB FALSE 7 august
AA TRUE 0 september
AA FALSE 18 september
型
在做
但是,如果值具有相同的前缀,我该如何分组?任何建议都很感激。
out = (
df.assign(type= df["name"].astype(
pd.CategoricalDtype(["TRUE", "FALSE"], ordered=True)))
.groupby([df["name", "date"].str.split(":").str[0], "type"],
dropna=False, group_keys=False)["size"].sum().reset_index()
)
型
但是,我不确定如何在这个分组中合并多个字段。任何建议都很感激。
1条答案
按热度按时间r8uurelv1#
你能做到的
字符串