我有一个具有列userid和索引值的数据集。
+---------+--------+
| userid | index|
+---------+--------+
| user1| 1|
| user2| 2|
| user3| 3|
| user4| 4|
| user5| 5|
| user6| 6|
| user7| 7|
| user8| 8|
| user9| 9|
| user10| 10|
+---------+--------+
我想给它添加一个新的Dataframe,并为新添加的列添加一个索引。这个 userid
是唯一的,并且现有Dataframe将不具有dataframe 2用户ID。
+----------+
| userid |
+----------+
| user11|
| user21|
| user41|
| user51|
| user64|
+----------+
预计新增产量 userid
和索引
+---------+--------+
| userid | index|
+---------+--------+
| user1| 1|
| user2| 2|
| user3| 3|
| user4| 4|
| user5| 5|
| user6| 6|
| user7| 7|
| user8| 8|
| user9| 9|
| user10| 10|
| user11| 11|
| user21| 12|
| user41| 13|
| user51| 14|
| user64| 15|
+---------+--------+
是否可以通过传递一个最大索引值并从给定的索引值开始第二个Dataframe的索引来实现这一点。
1条答案
按热度按时间bvhaajcl1#
如果userid具有某种顺序,那么可以使用rownumber函数。即使没有,也可以使用单调递增的\u id()添加id。目前,我假设可以订购userid。然后你可以这样做:
编辑:在评论讨论之后。