在Mac上打开Pandas中的CSV文件时出现UTF-8错误

s5a0g9ez  于 2023-07-31  发布在  Mac
关注(0)|答案(2)|浏览(156)

我试图在我的Mac上使用utf8打开一个带有日语字符的csv文件。
我使用的代码如下:

foo = pd.read_csv("filename.csv", encoding = 'utf8')

字符串
但是,我收到了以下错误消息。

'utf-8' codec can't decode byte 0x96 in position 0


我试着四处寻找,但很多解决方案似乎是为windows/我还没有任何成功的其他解决方案。
感谢帮助!

zpgglvta

zpgglvta1#

看来你的文件真的有一个非unicode字符。此文件的正确编码在很大程度上取决于其内容,但在最常见的情况下,0x 96可以使用CP-1252解码。所以,试着像下面这样解码它:

foo = pd.read_csv("filename.csv", encoding = 'cp1252')

字符串
如果您不知道文件的原始编码,可以尝试使用第三方库(如chardet)检测它。
如果你上传一部分文件来重现这个问题,我可能会帮你更多。

zzzyeukh

zzzyeukh2#

以数字格式打开文件并将其导出到csv。您可能会注意到,文件保存在目标文件夹中没有“.csv”扩展名,这很好。现在使用<pd.read_csv(“filename.csv”)>访问该文件。对我很有效

相关问题