python-3.x 值仅位于新类别的第一行，如何填充缺失值

6uxekuva 于 2022-12-05 发布在 Python

关注(0)|答案(1)|浏览(121)

我正在尝试用PANDAS清除Excel文件中的数据。

我希望填充类别和子类别列中缺少的值。

我在想一个for循环，但我不确定我会怎么做。有人知道或有更好的想法来管理这些数据吗？

1条答案

Pandas提供了一个方便的.fillna()方法。假设您的数据存储在spreadsheet.csv中，您可以使用下面的代码。ffill方法是“forward fill”的缩写，意思是它将向下搜索每一列，并用上面的值填充缺失的值。

df = pd.read_csv('spreadsheet.csv')
df.fillna(method='ffill')

或者，如果要手动为每一列指定填充值，可以将字典传递到.fillna()中，使用列名作为键，使用替换作为值。例如：

df.fillna({'Category': 'new category value', 
           'SubCategory': 'new subcategory', 
           'Product': "No product"})