我尝试创建一个新的国家分类列,其中包含特定的百分比值。以下面的数据集为例:
df = sns.load_dataset("titanic")
我正在尝试使用以下脚本获取新列:
country = ['UK', 'Ireland', 'France']
df["country"] = np.random.choice(country, len(df))
df["country"].value_counts(normalize=True)
UK 0.344557
Ireland 0.328844
France 0.326599
但是,我得到的所有国家都有相同的计数。我想要每个国家的具体计数:
- 所需输出**
df["country"].value_counts(normalize=True)
UK 0.91
Ireland 0.06
France 0.03
什么是理想的方式来获得所需的输出?任何建议将不胜感激。谢谢!
1条答案
按热度按时间dbf7pr2w1#
是否更改
numpy.random.choice
的概率?输出量:
如果需要精确的值数(在精度限制内):
输出量: