我以前
df= pd.read_excel(file_add, sheet_name='sheet 1')
df= df.replace(r'^\s+$', np.nan, regex=True)
df.dropna(subset=['column 1', 'column 2'], inplace=True)
导入我的excel文件并删除空行。我发现excel文件中一些有背景色的空行仍然存在。
是因为背景颜色还是我做错了什么?我试着删除单元格中的空格,但没有用。我可能需要先转换成CSV格式。
测试次数
import pandas as pd
import numpy as np
file_add = '<your_path>'
df= pd.read_excel(file_add, sheet_name='sheet 1')
df= df.replace(r'^\s+$', np.nan, regex=True)
df.dropna(subset=['column 1', 'column 2'], inplace=True)
1条答案
按热度按时间dsekswqp1#
你需要用openpyxl,用那个库读入你的excel文件,然后用那个包打开文件,过滤颜色,然后你就可以用Pandas了。