我试图读取csv这是在zip文件.我的任务是读取文件rad_15min.csv文件,但问题是当我读取zip文件(我复制链接地址通过点击下载按钮)它给我错误:
产品代码:
import pandas as pd
df = pd.read_csv('https://www.kaggle.com/datasets/lucafrance/bike-traffic-in-munich/download?datasetVersionNumber=7')
字符串
**错误:**ParserError:标记数据时出错。C错误:第9行应为1个字段,看到2个
数据:https://www.kaggle.com/datasets/lucafrance/bike-traffic-in-munich
Zip文件链接:https://www.kaggle.com/datasets/lucafrance/bike-traffic-in-munich/download?datasetVersionNumber=7
我必须动态地读取这个csv,我不想下载它,所有只是为了制作一个下载链接,然后动态地读取csv。有没有其他方法,我可以尝试?
2条答案
按热度按时间2lpgd9681#
对我来说,它是转发到HTML页面,而不是下载。为什么不使用提供的kaggle API?(您需要首先提供一个令牌)
这就是我所尝试的:
字符串
我得到的结果是:
型
hlswsv352#
rad15_min.csv
的zip
文件,带有pandas*您可以尝试使用__Host-KAGGLEID cookie创建request。
我不确定是否有一个简单的方法来获得这个cookie,但你可以硬编码它。在键盘上,按下(CTRL+ CTRL +I)打开浏览器的开发者工具,转到
Applications
/Cookies
并复制相关cookie(并确保你在kaggle之前登录过)。字符串
注意:如果
zip
只有一个csv,或者数据集不是存档(* 即单个csv*),则可以将BytesIO(response.content)
直接传递给read_csv
。输出量:
型