我需要提取md-card容器中的上下文,按照所附的图像。我只需要得到文本或任何格式的摘录。我试过使用BS,但它不起作用。请提出做这项工作的方法。谢谢。
enter image description here
import requests from bs4 import BeautifulSoup
page = requests.get('https://www.plugshare.com/location/81189')
soup = BeautifulSoup(page.content, 'html.parser')
#x = soup.find_all('div')
x = soup.find_all('md-card')
#print(page.status_code)
print(x)
2条答案
按热度按时间v8wbuo2f1#
因此,根据你的问题的初始状态,只是给予你一个想法,你应该筛选你的
soup
有一个<script>
,其中包含一些信息-如果你需要更多或具体检查我的评论:网站的内容由JavaScript动态加载。由于requests模块只加载初始静态源,这与呈现动态内容并操纵结构的浏览器的行为不同,beautifulsoup无法找到所需的元素。替代解决方案:找到提供信息的API调用,或者使用Selenium或模仿浏览器行为的其他模块。
示例
输出
7gs2gvoe2#
正如@HedgeHog所说,数据是从外部URL加载的。要获取Json格式的所有数据,您可以尝试:
图纸: