python-3.x 值仅位于新类别的第一行,如何填充缺失值

6uxekuva  于 2022-12-05  发布在  Python
关注(0)|答案(1)|浏览(121)

我正在尝试用PANDAS清除Excel文件中的数据。

我希望填充类别和子类别列中缺少的值。

我在想一个for循环,但我不确定我会怎么做。有人知道或有更好的想法来管理这些数据吗?

ljsrvy3e

ljsrvy3e1#

Pandas提供了一个方便的.fillna()方法。假设您的数据存储在spreadsheet.csv中,您可以使用下面的代码。ffill方法是“forward fill”的缩写,意思是它将向下搜索每一列,并用上面的值填充缺失的值。

df = pd.read_csv('spreadsheet.csv')
df.fillna(method='ffill')

或者,如果要手动为每一列指定填充值,可以将字典传递到.fillna()中,使用列名作为键,使用替换作为值。例如:

df.fillna({'Category': 'new category value', 
           'SubCategory': 'new subcategory', 
           'Product': "No product"})

相关问题