我在Python中有一个数据框,看起来像这样:
| 识别号|日期|数值1|数值2|
| - ------|- ------|- ------|- ------|
| 小行星123|二○二三年一月|三十二|二十一|
| 小行星123|二○二三年一月|五十四|四十三|
| 小行星13459|二○二○年十月二日|十九|五十八|
| 小行星13459|二○二○年十月二日|十九|八十五|
| 小行星13459|二○二○年十月二日|十九|三十四|
| 小行星123|二○一七年六月四日|五十四|二十二|
| 小行星123|二○一七年六月四日|三十三|三十一|
我想创建一个名为“indicator”的新列,它将具有二进制值- 1或:如果同一个人在同一天具有相同的值“值1”(或“值2”),则为1。因此,例如,由于“Value_1”在2020年10月2日为19,因此人员13459的值为1。它应如下所示:
| 识别号|日期|数值1|数值2|指标|
| - ------|- ------|- ------|- ------|- ------|
| 小行星123|二○二三年一月|三十二|二十一|无|
| 小行星123|二○二三年一月|五十四|四十三|无|
| 小行星13459|二○二○年十月二日|十九|五十八。|1个|
| 小行星13459|二○二○年十月二日|十九|八十五|1个|
| 小行星13459|二○二○年十月二日|十九|三十四|1个|
| 小行星123|二○一七年六月四日|五十四|二十二|1个|
| 小行星123|二○一七年六月四日|三十三|二十二|1个|
问题是同一个人多次填写问卷,即在多个日期填写问卷,我想看看哪个人在一年中的同一天有相同的答案。
我正在和Pandas一起工作。谢谢!
2条答案
按热度按时间plupiseo1#
按
ID, Date
分组,检查每组中Value 1
或Value 2
是否具有相同的值:xwbd5t1u2#
另一种方法是使用
melt
和merge
,这将允许您在多个列上运行此操作。打印(df_out)