我有一个这样的数据集
Name Age
Aaron 42
Steve 44
Richard 29
我必须创建一个新的列,我必须使用字符串填充该列..列名将是'vaccinated_or_not',它应该有值'是','否','信息丢失','未提供','正在进行中'...所以,我必须填写这一列'vaccinated_or_not'使用这5个字符串随机...有人可以帮助我如何实现它。
最终的数据集应该是这样的:
Name Age Vaccinaited_or_not
Aaron 42 Yes
Steve 44 Info Missing
Richard 29 No
2条答案
按热度按时间u5rb5r591#
使用
numpy.random.choice
:p5cysglq2#
使用
np.random.choice
:您还可以提供权重:
最佳实践:使用RandomGenerator
权重说明:使用权重/概率对于理解数据很重要:
输出:x1c 0d1x