pandas 如何从Yahoo获取ESG历史数据?

f87krz0w  于 2023-05-12  发布在  其他
关注(0)|答案(3)|浏览(169)

我正在尝试使用Python从雅虎财经上的Sustainalytics抓取历史ESG数据。具体来说,假设我想要一个给定的成分列表的过去10年的ESG得分。
以下代码行提供了最新的ESG分数。但我想刮过去的ESG表现。我基本上在寻找从2010年1月到2020年12月的年度(每月,如果可能的话)ESG。我想自动抓取并保存在一个txt或csv文件的数据。

# import yfinance, pandas and os
import yfinance as yf
import pandas as pd
import os

单个股票代码:

msft = "MSFT"
msft_y = yf.Ticker(msft)
esg_data = pd.DataFrame.transpose(msft_y.sustainability)
esg_data['company_ticker'] = str(msft_y ticker)

它返回一个27行的dataframe,其中包含Microsoft的ESG相关信息。
标准普尔500指数代码:

# Import list of tickers from file
os.chdir("C:\...")
sp_500 = pd.read_csv('SP_500_tickers.csv')
# Retrieve Yahoo! Finance Sustainability Scores for each ticker
for i in sp_500['ticker_code']:
    # print(i)
    i_y = yf.Ticker(i)
    try:
        if i_y.sustainability is not None:
            temp = pd.DataFrame.transpose(i_y.sustainability)
            temp['company_ticker'] = str(i_y.ticker)
            # print(temp)
            esg_data = esg_data.append(temp)
    except IndexError:
        pass

它返回一个关于标准普尔500指数成分股ESG数据的数据框架,我们可以使用它进行分析。其背后的想法是创建“好”和“坏”ESG公司的投资组合,并比较业绩,以了解股价在不同历史时期的表现。
到目前为止,这些代码无法获取过去日期的ESG数据。

hkmswyz6

hkmswyz61#

我无法使用requests.get,因为连接被禁止。错误403。所以我试着从下面的StackOverflow板使用urllib.request.urlopen。访问Python; urllib error: AttributeError: 'bytes' object has no attribute 'read'

import pandas as pd
from datetime import datetime as dt
import urllib.request
import json
dataframes = []
url = "https://query2.finance.yahoo.com/v1/finance/esgChart?symbol=A"

connection = urllib.request.urlopen(url)

data = connection.read()
data_2 = json.loads(data)
Formatdata = data_2["esgChart"]["result"][0]["symbolSeries"]
Formatdata_2 = pd.DataFrame(Formatdata)
Formatdata_2["timestamp"] = pd.to_datetime(Formatdata_2["timestamp"], unit="s")

预览打印putty显示的数据

print(Formatdata_2.head())

其余代码改编自putty

2vuwiymt

2vuwiymt2#

您可以使用Yahoo Finance端点,它应该会为您提供每月的ESG分数,治理分数,环境分数和社会分数。但不要以为它可以追溯到那么远:

import pandas as pd
import requests

# Read in your symbols
sp_500 = pd.read_csv("SP_500_tickers.csv")

# Endpoint
url = "https://query2.finance.yahoo.com/v1/finance/esgChart"

# List of dataframes
dataframes = []

for symbol in sp_500["ticker_code"]:
    response = requests.get(url, params={"symbol": symbol})
    if response.ok:
        df = pd.DataFrame(response.json()["esgChart"]["result"][0]["symbolSeries"]
        df["symbol"] = symbol
        dataframes.append(df)

df = pd.concat(dataframes)
df["timestamp"] = pd.to_datetime(df["timestamp"], unit="s")

预览:

>>> df.head()
   timestamp  esgScore  governanceScore  environmentScore  socialScore symbol
0 2014-09-01      61.0             62.0              74.0         45.0   AAPL
1 2014-10-01      60.0             62.0              74.0         45.0   AAPL
2 2014-11-01      61.0             62.0              74.0         45.0   AAPL
3 2014-12-01      61.0             62.0              74.0         45.0   AAPL
4 2015-01-01      61.0             62.0              74.0         45.0   AAPL
w41d8nur

w41d8nur3#

1转到雅虎财经。2在搜索字段中输入报价。3在搜索结果中选择报价以查看报价。4单击历史数据。5选择时间段、要显示的数据和频率。6单击应用。7要脱机使用数据,请执行click Download

相关问题