我试图从下面给出的网站中提取此表:
https://bills.parliament.nz/bills-proposed-laws?Tab=All&Period=0&To=2023-05-22&From=2018-01-01&SelectCommittee=a0f103be-0902-4480-9778-93a5229dca71
下面是我的代码:
import requests
from bs4 import BeautifulSoup
import pandas as pd
a = requests.get('https://bills.parliament.nz/bills-proposed-laws?Tab=All&Period=0&To=2023-05-22&From=2018-01-01&SelectCommittee=a0f103be-0902-4480-9778-93a5229dca71')
a.status_code
soup = BeautifulSoup(a.content, 'html.parser')
table2 = soup.find("div", class_="d-none d-lg-block")
print(table2)
# Output -->
#[]
使用bs 4,我尝试提取表。
我也试过使用xpath,但没有成功。
任何帮助将不胜感激!
1条答案
按热度按时间odopli941#
您不能直接使用
requests
进行提取,因为内容是动态加载的。但是,您可以使用他们的API:输出:
Pandas dataframe:
输出:
要提取子数据,请执行以下操作:
输出: