我正在尝试使用pandas读取一个csv文件,其中包含以下行:
df = pd.read_csv('BLOCKS-0-100000.csv', header=0, sep=',', quotechar='"')
问题是我在其中一个记录中有这个值:
"[\"0x27d49d2c20203f4e6332d75898dc96f10db405951df6b5bcd8b8246087b4b382,0x26870f44764828d6bad7ce106c98bc5231dfd3e0d88607b9cd31927a6c0bf811\"]"
我嵌套了引号,pandas给了我以下错误:pandas.errors.ParserError: Error tokenizing data. C error: Expected 13 fields in line 577, saw 14
我也试过:
df = pd.read_csv('BLOCKS-0-100000.csv', header=0, sep=',', quoting=csv.QUOTE_NONE)
有没有办法在不修改文件的情况下调试它?
提前多谢了。
1条答案
按热度按时间thigvfpy1#
可以使用
read_csv
函数的escapechar
关键字参数:这将转义前面有
\
的quotechar
,因此将适用于您的输入,因为您有两个\"
。