在Python中使用requests.get()下载一个.csv文件

jyztefdp  于 2023-09-28  发布在  Python
关注(0)|答案(1)|浏览(97)

我想使用请求从此页面下载.CSV文件**https://data.anbima.com.br/certificado-de-recebiveis?view=precos**。Get()。当我使用Inspect时,没有直接指向文件的链接。
页面可能使用API调用下载。我已经使用Chrome上的网络面板研究了请求,但我陷入了如何在Python中传递正确参数的困境。
我正在尝试使用requests.get(link,params=)

f3temu5u

f3temu5u1#

尝试使用Pandas库,它会自动从URL下载csv,现在Pandas Read CSV Documentation

import pandas as pd
csv_url = 'csv_url'
df=pd.read_csv(csv_url)

或者,您可以使用lxml并请求库来抓取csv链接。从网页中获取link元素的XPath,并将链接URL字符串保存为var。
注意lxml作为列表返回。

from lxml import html
from lxml import etree
import requests

            
url = 'website'
#Open webpage
session_requests = requests.session()
result = session_requests.get(url)
tree = html.fromstring(result.text)

#xpath to csv URL (inspect element and right click to get xpath)

url_list = tree.xpath('xpath') #to get the link add /@href to the end of your xpath

#xpath returns link as a list, this just pulls link text out of the list
csv_url = url_list[0]

相关问题