如何从以下数据框中的每组(列Name
)中随机选择一行:
Distance Name Time Order
1 16 John 5 0
4 31 John 9 1
0 23 Kate 3 0
3 15 Kate 7 1
2 32 Peter 2 0
5 26 Peter 4 1
预期结果:
Distance Name Time Order
4 31 John 9 1
0 23 Kate 3 0
2 32 Peter 2 0
7条答案
按热度按时间5jvtdoz21#
您可以在
Name
列上使用groupby
并应用sample
zbsbpyhn2#
例如,您可以使用
numpy
函数random.permutation
对所有样本进行混洗。然后groupby
乘以Name
,并从每组中取N行:dfuffjeb3#
你可以使用
unique
来实现xqnpmsa84#
打乱 Dataframe :
然后删除重复的行:
wljmcqd85#
这应该有帮助,但这不是随机选择,它保持了第一
cwxwcias6#
如何使用random
就像这样
导入您提供的数据,
看起来像这样
然后得到一个随机的列名
在它下面选择了“姓名”,
当然我可以把它浓缩成,
bis0qfac7#