已关闭。此问题需要details or clarity。当前不接受答案。
**想要改进此问题?**添加详细信息并通过editing this post阐明问题。
5天前关闭。
Improve this question
数据集中有关于汽车的品牌和型号的信息。我能够确定每个模型在这个数据集中出现的次数。有必要根据它们重复的频率将模型分组(例如:如果模型重复次数少于x次,则模型名称将被替换为“稀有模型”)。定义阈值。
如何以最简单、最有效的方式做到这一点?[ enter image description here ](https://i.stack.imgur.com/A4j1E.png)
1条答案
按热度按时间zwghvu4y1#
您可以使用
transform
将计数广播到每一行,然后使用pd.cut
获取离散类别: