csv 标记数据时出错,C错误：第37行中预期有5个字段，看到6个

wqsoz72f 于 2023-09-28 发布在其他

关注(0)|答案(2)|浏览(102)

我想把这个txt文件做成一个dataframe。
我尝试更改分隔符或使用多个分隔符或引用csv.QUOTE_NONE，但无法读取此文件。请帮帮忙。

df = pd.read_csv('../sort.txt', delimiter=',', header=None, quoting=csv.QUOTE_NONE, encoding='utf-8')
df

2条答案

试试这个：

import pandas as pd

df = pd.read_csv('../sort.txt', header=None, quotechar='"')
print(df)

我认为问题在于双引号内的换行符使pd.read_csv将其解释为新行。因此，现在解析文件是正确的，将双引号中的逗号视为字段的一部分，而不是分隔符。

这是由于.txt格式的文件。注意，分隔符,的数量在每一行上不相同。您可以在read_csv()上添加names参数：

url = 'https://raw.githubusercontent.com/absingh22/read_csv/main/sort.txt'
df = pd.read_csv(url,sep=',',names=[0,1,2,3,4,5,6],header=None)