我的python代码有问题。我正在尝试合并数据框中的行。我有这样的想法:
代码\u idsize1234…18代码12345bigx…12345big.x…def67890中等…x…ghi67890中等…x…jkl13579小…x…xyz
我想按代码id合并重复项,但我想加入代码列中的字符串。就像这样:
代码12345bigxx……;DEF67890中等..xx….ghi;JKL13579小…x…xyz
我和阿格一起做的,但这只是工作的一部分。
g_df = df.groupby("CODE_ID")
group = g_df["CODE"].agg(lambda column: "; ".join(column))
group = group.reset_index(name="CODE")
因为结果是这样的:
代码\u idcode12345;def67890ghi;jkl13579xyz公司
如何添加其余列?或者也许这样做是错误的?
1条答案
按热度按时间xa9qqrwz1#
你可以转换
X
s和.
s到1/0,然后groupby
以及max
,并将其Map回X
s和.
学生:输出: