我有两个 Dataframe
第一个月
ID Year Primary_Location Secondary_Location Sales
0 11 2023 NewYork Chicago 100
1 11 2023 Lyon Chicago,Paris 200
2 11 2023 Berlin Paris 300
3 12 2022 Newyork Chicago 150
4 12 2022 Lyon Chicago,Paris 250
5 12 2022 Berlin Paris 400
df2
ID Year Primary_Location Sales
0 11 2023 Chicago 150
1 11 2023 Paris 200
2 12 2022 Chicago 300
3 12 2022 Paris 350
对于具有相同ID
和Year
的每个组,我希望:将列Sales
从df2
添加到df1
中的Sales
,其中df2
中的Primary_Location
出现(包含)在df1
中的Secondary_Location
中。
例如:对于ID=11
和Year=2023
,Lyon
的Sales
将添加到Chicago
的Sales
和df_2
的Paris
的Sales
。
该行的Paris
的新Sales
将为200 + 150 + 200 = 550。
预期产出为:
df_primary_output
ID Year Primary_Location Secondary_Location Sales
0 11 2023 NewYork Chicago 250
1 11 2023 Lyon Chicago,Paris 550
2 11 2023 Berlin Paris 500
3 12 2022 Newyork Chicago 400
4 12 2022 Lyon Chicago,Paris 900
5 12 2022 Berlin Paris 750
2条答案
按热度按时间83qze16e1#
你的问题没那么简单...
您确定第3行的结果是450而不是400吗?
dauxcl2d2#
这应该行得通:
或
原始答复:
输出: