我有一个数据框,里面有很多变量。这些变量是类别,我想把它们转换成数字值。
例如,我在 Dataframe 的变量中有以下值:
ID | VarEx
0 | key
1 | door
2 | key
3 | key
4 | chair
5 | chair
6 | tv
7 | door
8 | tv
我想用一个循环来替换numbers中的值,因为在其他变量中我有大约1000个不同的值,这是我所期望的出口:
ID | VarEx
0 | 0
1 | 1
2 | 0
3 | 0
4 | 2
5 | 2
6 | 3
7 | 1
8 | 3
我怎么能用一个循环来实现呢?
2条答案
按热度按时间zte4gxcn1#
另一种可能的解决方案:
输出:
ffx8fchx2#
下面是使用
pd.factorize()
的方法