下面是一个例子:
ID area data_info
a001 NY [{color: 'Yellow', 'count': 3, 'weight': 5}, {color: 'Blue', 'count': 2, 'weight': 11} , {color: 'Red', 'count': 7, 'weight': 3}]
a002 SF [{color: 'Green', 'count': 1, 'weight': 14},{color: 'Yellow', 'count': 9, 'weight': 2}]
a003 NY [{color: 'Blue', 'count': 5, 'weight': 6}, {color: 'Black', 'count': 2, 'weight': 15}]
字符串
具有相同面积的行将合并组合data_info中的信息,并基于相同的color键值聚合计数和权重。
预期结果:
ID a001和a003都具有相同的区域NY,因此data_info的值将合并并聚合到一行中。由于a001和a003在字典中的颜色为:Blue,因此它将聚合count的总和和weight的总和。
area data_info
NY [{color: 'Yellow', 'count': 3, 'weight': 5}, {color: '**Blue**', 'count': **7**, 'weight': **17**} , {color: 'Red', 'count': 7, 'weight': 3}, {color: 'Black', 'count': 2, 'weight': 15}]
SF [{color: 'Green', 'count': 1, 'weight': 14},{color: 'Yellow', 'count': 9, 'weight': 2}]
型
3条答案
按热度按时间wwtsj6pe1#
data_info
(字典列表)中具有有效的数据结构。*您可以使用
pd.json_normalize
从data_info
列中提取数据:字符串
输出量:
型
中间步骤
型
gkl3eglg2#
经典的for循环方式。它在结尾创建一个文件(result.txt)以更好地查看结果。
验证码:
字符串
输出:
型
nzrxty8p3#
使用自定义函数和
groupby.agg
:字符串
输出量:
型