pandas read_csv无法处理双引号中的额外逗号

soat7uwm  于 12个月前  发布在  其他
关注(0)|答案(2)|浏览(84)

似乎这个问题已经解决了很多次,但我无法解决它。下面是我的CSV的最小示例:

Issue, Content
Test, "A, B"
Test, "A, B, C"

下面是read_csv代码(尝试了各种参数组合):

df = pd.read_csv('data.csv', delimiter=",", quotechar='"', encoding="utf-8")

错误如下:解析器错误:
标记数据时出错。C错误:第3行中预期有3个字段,看到4个
我用纯文本编辑器创建了CSV文件。也想知道为什么解释器需要3个字段。

f4t66c6m

f4t66c6m1#

尝试

df = pd.read_csv('data.csv', delimiter=",", quotechar='"', skipinitialspace = True, encoding="utf-8")
3hvapo4f

3hvapo4f2#

在这种情况下,你需要什么分隔符?
如果你按照帖子pandas read csv with extra commas in column,它应该是:

df = pd.read_csv('data.csv', quotechar="'", encoding="utf-8", sep=",")

相关问题