csv 标记数据时出错,C错误:第37行中预期有5个字段,看到6个

wqsoz72f  于 2023-09-28  发布在  其他
关注(0)|答案(2)|浏览(102)

我想把这个txt文件做成一个dataframe。
我尝试更改分隔符或使用多个分隔符或引用csv.QUOTE_NONE,但无法读取此文件。请帮帮忙。

df = pd.read_csv('../sort.txt', delimiter=',', header=None, quoting=csv.QUOTE_NONE, encoding='utf-8')
df

文件:https://github.com/absingh22/read_csv

qaxu7uf2

qaxu7uf21#

试试这个:

import pandas as pd

df = pd.read_csv('../sort.txt', header=None, quotechar='"')
print(df)

我认为问题在于双引号内的换行符使pd.read_csv将其解释为新行。因此,现在解析文件是正确的,将双引号中的逗号视为字段的一部分,而不是分隔符。

ar5n3qh5

ar5n3qh52#

这是由于.txt格式的文件。注意,分隔符,的数量在每一行上不相同。您可以在read_csv()上添加names参数:

url = 'https://raw.githubusercontent.com/absingh22/read_csv/main/sort.txt'
df = pd.read_csv(url,sep=',',names=[0,1,2,3,4,5,6],header=None)

相关问题