使用pandas [duplicate]正确读取python中的csv文件

egmofgnx  于 2023-04-09  发布在  Python
关注(0)|答案(1)|浏览(157)

此问题已在此处有答案

Reading tab-delimited file with Pandas - works on Windows, but not on Mac(3个答案)
Import CSV file as a Pandas DataFrame(6个答案)
pandas read_csv not recognizing \t in tab delimited file(1个答案)
Parsing a tab-delimited .txt into a Pandas DataFrame(1个答案)
4天前关闭。
我尝试在pandas(python)中使用read_csv读取this file。但我无法捕获所有列。您能帮助吗?
代码如下:

file = r'path of file'
df = pd.read_csv(file, encoding='cp1252', on_bad_lines='skip')
v2g6jxz6

v2g6jxz61#

我尝试读取您的文件,首先注意到您指定的编码与文件中使用的编码不对应。我还注意到分隔符不是逗号(,),而是制表符(\t)。
首先,要获取文件编码(在Linux中),您只需运行:

$ file -i kopie.csv 
kopie.csv: text/plain; charset=utf-16le

在Python中:

import pandas as pd

path_to_file = 'kopie.csv'
df = pd.read_csv(path_to_file, encoding='utf-16le', sep='\t')

当我打印加载的 Dataframe 的形状时:

>>> df.shape
(869, 161)

相关问题