**方案:**如果一个编号有两条记录,一条带有删除原因,另一条带有撤消删除原因,则只选择删除。如果一个编号只有一条带有撤消删除或删除原因的记录,则也会选择该编号。
**示例:**我有一个包含2列的 Dataframe ,如下所示:
| 数|原因|
| - ------|- ------|
| 1234|德尔|
| 1234|温德尔|
| 小行星4567|德尔|
| 小行星6789|温德尔|
| 小行星2423|德尔|
| 小行星2423|温德尔|
我的预期输出如下所示:
| 数|原因|过滤器|
| - ------|- ------|- ------|
| 1234|德尔|1个|
| 1234|温德尔|无|
| 小行星4567|德尔|1个|
| 小行星6789|温德尔|1个|
| 小行星2423|德尔|1个|
| 小行星2423|温德尔|无|
这里我只想过滤掉tofilter为1的记录。
3条答案
按热度按时间xeufq47z1#
您可以从您提供的 Dataframe 中生成预期的输出,假设只有两个样本,以防数字重复。
其输出:
hc8w905p2#
下面是我对窗口函数的尝试
当你最多有2条记录,一条带del,第二条带undel时,它只适用于描述的场景。如果有重复的记录,它需要调整
输出为:
dbf7pr2w3#
窗口功能是你的朋友,如果你想过滤做以下
如果要显示0和1,请执行以下操作