此问题在此处已有答案:
(9个答案)
7小时前关闭。
我几周前开始学习Python的数据科学,在我自己的项目中遇到了这个问题。我试图在计数低于5时将游戏发行商名称替换为“其他”。当我使用.mask时()函数,但是它似乎也将“Count”值替换为“Other”。有没有可能将“Publisher”值更改为“Other”并保留“Count”价值如?
我尝试的方法如下:
publisher_subset = data.filter(['Publisher'])
df = publisher_subset.value_counts().reset_index(name='Counts')
df.mask(df["Counts"] <= 5, "Other", inplace=False)
3条答案
按热度按时间r3i60tvu1#
您正在寻找的页面
vkc1a9a22#
可以使用.loc[]索引器有选择地将掩码仅应用于Publisher列。
ryhaxcpt3#
如果仅选择
Publisher
列,则可以使用mask
:我想你也想用
Publisher
求和: