我有一个Pandas数据框正在从ftp导入,我需要修剪,只显示那些行的一个或多个列有空白单元格,因为这需要发送回来,让我们的管理团队填写缺失的数据。我可以使用isna()方法来实现这一点。然而,在其中一列“管理人口”中,正确的值之一是字符串“NA”,因此,对于包含“NA”的单元格,isna()当然也会阅读TRUE,我需要找到一种方法来阻止这种情况的发生,并保留字符串“NA”的示例。
zzlelutf1#
我发现了这个问题,不是isna(),而是read_csv的默认行为导致了这个问题。所以我创建了一个列表来存储我需要Pandas看到的NaN值:
myNAValues = ['-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A N/A', '#N/A', 'N/A', 'n/a', '', '#NA', 'NULL', 'null', 'NaN', '-NaN', 'nan', '-nan', '']
然后修改read_csv以包括:第一个月现在输出符合我的要求
1条答案
按热度按时间zzlelutf1#
我发现了这个问题,不是isna(),而是read_csv的默认行为导致了这个问题。所以我创建了一个列表来存储我需要Pandas看到的NaN值:
然后修改read_csv以包括:第一个月
现在输出符合我的要求