我有一个包含user_id和flags的 Dataframe ,我想为同一个user_id中的连续false标记创建单独的组,但我很难让它工作。
Dataframe 如下所示:
+-------+-----+
|user_id| keep|
+-------+-----+
| 1| true|
| 1| true|
| 1|false|
| 1|false|
| 1| true|
| 1| true|
| 2| true|
| 2| true|
| 2|false|
| 2|false|
| 2|false|
| 2| true|
| 2|false|
| 2|false|
| 2| true|
| 3| true|
| 4| true|
| 5| true|
| 5|false|
| 5|false|
+-------+-----+
预期结果:
+-------+-----+-----+
|user_id| flag|group|
+-------+-----+-----+
| 1| true| 0|
| 1| true| 0|
| 1|false| 1|
| 1|false| 1|
| 1| true| 0|
| 1| true| 0|
| 2| true| 0|
| 2| true| 0|
| 2|false| 1|
| 2|false| 1|
| 2|false| 1|
| 2| true| 0|
| 2|false| 2|
| 2|false| 2|
| 2| true| 0|
| 3| true| 0|
| 4| true| 0|
| 5| true| 0|
| 5|false| 1|
| 5|false| 1|
+-------+-----+-----+
你知道我该怎么做吗?
2条答案
按热度按时间nvbavucw1#
希望我理解你的问题是正确的。请检查我的答案,看看它是否工作,你的意图
wmomyfyw2#
输出: