Pandas中的无名柱和Nan

vcirk6k6  于 2023-06-28  发布在  其他
关注(0)|答案(3)|浏览(104)

我得到Unnamed和楠在输出时,我试图打印的.csv文件的标题。
将pandas导入为pd

df = pd.read_csv('testextract.csv', error_bad_lines=False,sep=' ',dtype=unicode,index_col=0,low_memory=False)
print(df.head())

输出:

Unnamed: 1 Unnamed: 2 Unnamed: 3 Unnamed: 4 Unnamed: 5 Unnamed: 6  \
��T                                                                     
NaN        NaN        NaN        NaN        NaN        NaN        NaN   
NaN        NaN        NaN        NaN        NaN        NaN        NaN
svdrlsy4

svdrlsy41#

使用“~”(按位非)运算符从 Dataframe 中提取整行,不包括命名为“未命名”的列。

data = df.loc[:, ~df.columns.str.contains('^Unnamed')]
  print(data)
w3nuxt5m

w3nuxt5m2#

您正在阅读一个csv文件,并使用分隔符作为“”。使用以下代码pd.read_csv(file_name,encoding = 'UTF-8')

eeq64g8w

eeq64g8w3#

我也犯过同样的错误。您必须更改编码以确保它是UTF-8。您可以通过两种方式执行此操作:
1.使用Pandas的编码方法,即例如:

df = pd.read_csv('testextract.csv', encoding, errors='strict')

1.在电子表格应用程序中打开CSV文件并保存为UTF-8格式。然后,再次运行代码。
希望这能帮上忙。

相关问题