我在python pandas中有一个数据集,其中变量Engine_model的值缺失,但是我还有其他行具有相同的信息。
汽车_型号发动机_型号
宝马5 A型雷诺21 B型宝马5 NaN现代桑特罗C型
例如,在这里我有一个NaN,应该用'类型A'填充,因为该信息在第一行。我该怎么做?找到信息来填充NaN,知道它的发动机型号对于同一型号的所有汽车都是相同的?
我已获得缺失值的索引和缺失值的车型名称:
发动机模型缺失索引=数据[数据['发动机模型'].isnull()].索引
汽车 * 型号 *_缺失=数据.loc[发动机_型号_缺失 * 索引,'汽车_型号 *']
1条答案
按热度按时间r1zk6ea11#
我发现了一个similar solution,它指的是计算一个平均值来插补缺失值,基于此,一个工作解决方案可能是这样的:
输出结果为:
| | 车型|发动机_型号|
| - ------|- ------|- ------|
| 无|宝马5|A型|
| 1个|雷诺21|B型|
| 第二章|宝马5|A型|
| 三个|现代·桑特罗|C型|