读取未知编码格式的csv文件

yhuiod9q  于 2023-04-03  发布在  其他
关注(0)|答案(2)|浏览(121)

我试图在python中读取CSV文件(google colab).请,在下面的链接中找到附件文件:https://github.com/LeGentilHomme/CSV-FILE/blob/4b69985482e59906b64a540b9c0d0a7fce31a37e/exportIndicateurs(7).csv实际上,法语中的这个时间序列数据包含半列,变量包含在行中,而时间或日期则在列中。经过多次尝试,我得到的是一个表格,其中所有值和半列都在一列中,其余单元格显示NaN值。我尝试了以下代码:

df=pd.read_csv("exportIndicateurs(7).csv", delimiter=';',header=1, encoding='latin-1')
df

但我得到的结果,我已经在下面的图片附件。
感谢您的帮助Result picture

kadbb459

kadbb4591#

read_csv中使用(-*;)作为 * 正则表达式分隔符 *:

gh_link = "https://raw.githubusercontent.com/LeGentilHomme/CSV-FILE/4b69985482e59906b64a540b9c0d0a7fce31a37e/exportIndicateurs(7).csv"

df = pd.read_csv(gh_link, sep="-*;", header=2, engine="python")

输出:

iszxjhcz

iszxjhcz2#

请尝试使用“sep”而不是“delimiter”:

df = pd.read_csv("exportIndicateurs(7).csv", sep=';',header=1, encoding='latin-1')
print(df)

相关问题