我想抓取谷歌搜索结果,但每当我尝试这样做,程序返回一个空列表
from bs4 import BeautifulSoup
import requests
keyWord = input("Input Your KeyWord :")
url = f'https://www.google.com/search?q={keyWord}'
src = requests.get(url).text
soup = BeautifulSoup(src, 'lxml')
container = soup.findAll('div', class_='g')
print(container)
2条答案
按热度按时间hec6srdp1#
补充Andrej Kesely's的答案,如果你得到空的结果,你总是可以爬一个
div
* 向上 * 或 * 向下 * 测试,并从那里去。代码(比如你想抓取 * 标题 、 摘要 * 和 * 链接 *):
输出部分:
或者,您可以使用SerpApi的Google Search Engine Results API来实现这一点,这是一个付费API,可以免费试用。
输出部分:
免责声明我为SerpApi工作。
m1m5dgzv2#
要从google获取正确的结果页面,请指定
User-Agent
http header。对于仅英语结果,请在URL中输入hl=en
参数: