我有两个不同长度的 Dataframe ,它们有一个公共列。我需要做的是将它们组合起来,但要以一种平均分配非公共列中值的方式。因此,如果我们有Users:
User Category
John A
John D
Will A
Will E
Bea P
Bea E
Sarah A
Sarah B
并声称:
Category Claim
A 1
A 2
B 3
B 4
D 5
D 6
D 7
D 8
D 9
D 10
D 11
D 12
A 13
A 14
A 15
A 16
A 17
A 18
E 19
E 20
E 21
E 22
E 23
E 24
E 25
E 26
E 27
E 28
P 29
P 30
P 31
P 32
P 33
P 34
我想为每个用户提供一个平等的索赔数量的基础上类别-即索赔将被3个用户之间平均分割。
3条答案
按热度按时间gupuwyp21#
在这里,解释在评论中:
bd1hkmkf2#
数据:
0yg35tkg3#
以下是
data.table
的方法:实际上,您执行了一个完整的外部连接,然后设置一个索引,该索引为每个声明递增。然后,您将该索引按该类别中的用户数取模,然后使用该索引为该类别中的每个声明选择一个循环用户