我正在尝试用PANDAS清除Excel文件中的数据。
我希望填充类别和子类别列中缺少的值。
我在想一个for循环,但我不确定我会怎么做。有人知道或有更好的想法来管理这些数据吗?
ljsrvy3e1#
Pandas提供了一个方便的.fillna()方法。假设您的数据存储在spreadsheet.csv中,您可以使用下面的代码。ffill方法是“forward fill”的缩写,意思是它将向下搜索每一列,并用上面的值填充缺失的值。
.fillna()
spreadsheet.csv
ffill
df = pd.read_csv('spreadsheet.csv') df.fillna(method='ffill')
或者,如果要手动为每一列指定填充值,可以将字典传递到.fillna()中,使用列名作为键,使用替换作为值。例如:
df.fillna({'Category': 'new category value', 'SubCategory': 'new subcategory', 'Product': "No product"})
1条答案
按热度按时间ljsrvy3e1#
Pandas提供了一个方便的
.fillna()
方法。假设您的数据存储在spreadsheet.csv
中,您可以使用下面的代码。ffill
方法是“forward fill”的缩写,意思是它将向下搜索每一列,并用上面的值填充缺失的值。或者,如果要手动为每一列指定填充值,可以将字典传递到
.fillna()
中,使用列名作为键,使用替换作为值。例如: