我正在使用panda遍历一个csv。csv是不均匀的,即一些额外的列(在一些行)没有标题。我得到这个错误
pandas.errors.ParserError: Error tokenizing data. C error: Expected 11 fields in line 8, saw 12
我读了一些解决方案,但其中一些是跳过整个行和其他建议手动调整。我不能负担两者。我需要一个方法,可以删除额外的列保持行的其余部分。
这是数据的例子
Country Phone Fax
Germany 030-0074321 030-0076545
Mexico (5) 555-4729 (5) 555-3745
Mexico (5) 555-3932 NULL
67000 France 88.60.15.31 88.60.15.32
28023 Spain (91) 555 22 82 (91) 555 91 99
任何帮助都将不胜感激。
2条答案
按热度按时间mo49yndu1#
假设您有列[“A”、“B”、“C”、“D”、“E”]和4行, Dataframe df如下所示:
现在,如果要从第1行和第3行中删除额外的列“E”值,则只需创建另一个列表即可
因此,现在的输出为:
希望这对你有帮助!
lztngnrs2#
如果你知道你有多少列。
;[0,1,2,3 ...];是有内容列,否则您不知道