在pandas中阅读带引号的csv文件时出错

68bkxrlz  于 11个月前  发布在  其他
关注(0)|答案(1)|浏览(110)

我正在尝试使用pandas读取一个csv文件,其中包含以下行:

df = pd.read_csv('BLOCKS-0-100000.csv', header=0, sep=',', quotechar='"')

问题是我在其中一个记录中有这个值:

"[\"0x27d49d2c20203f4e6332d75898dc96f10db405951df6b5bcd8b8246087b4b382,0x26870f44764828d6bad7ce106c98bc5231dfd3e0d88607b9cd31927a6c0bf811\"]"

我嵌套了引号,pandas给了我以下错误:
pandas.errors.ParserError: Error tokenizing data. C error: Expected 13 fields in line 577, saw 14
我也试过:

df = pd.read_csv('BLOCKS-0-100000.csv', header=0, sep=',', quoting=csv.QUOTE_NONE)

有没有办法在不修改文件的情况下调试它?
提前多谢了。

thigvfpy

thigvfpy1#

可以使用read_csv函数的escapechar关键字参数:

df = pd.read_csv('BLOCKS-0-100000.csv', header=0, sep=',', quotechar='"', escapechar='\\')

这将转义前面有\quotechar,因此将适用于您的输入,因为您有两个\"

相关问题