我想把这个txt文件做成一个dataframe。我尝试更改分隔符或使用多个分隔符或引用csv.QUOTE_NONE,但无法读取此文件。请帮帮忙。
df = pd.read_csv('../sort.txt', delimiter=',', header=None, quoting=csv.QUOTE_NONE, encoding='utf-8') df
文件:https://github.com/absingh22/read_csv
qaxu7uf21#
试试这个:
import pandas as pd df = pd.read_csv('../sort.txt', header=None, quotechar='"') print(df)
我认为问题在于双引号内的换行符使pd.read_csv将其解释为新行。因此,现在解析文件是正确的,将双引号中的逗号视为字段的一部分,而不是分隔符。
ar5n3qh52#
这是由于.txt格式的文件。注意,分隔符,的数量在每一行上不相同。您可以在read_csv()上添加names参数:
,
read_csv()
names
url = 'https://raw.githubusercontent.com/absingh22/read_csv/main/sort.txt' df = pd.read_csv(url,sep=',',names=[0,1,2,3,4,5,6],header=None)
2条答案
按热度按时间qaxu7uf21#
试试这个:
我认为问题在于双引号内的换行符使pd.read_csv将其解释为新行。因此,现在解析文件是正确的,将双引号中的逗号视为字段的一部分,而不是分隔符。
ar5n3qh52#
这是由于.txt格式的文件。注意,分隔符
,
的数量在每一行上不相同。您可以在read_csv()
上添加names
参数: