我在做什么?我尝试使用SerpApi的 *Google Scholar API**来获取出版商的文章,并希望所有文章标题都存储在数组$title
中,但它仅限于前100篇文章。
任何帮助都将不胜感激,代码:
title.py
from serpapi import GoogleSearch
import sys
id = sys.argv[1]
key = sys.argv[2]
params = {
"engine": "google_scholar_author",
"author_id": id,
"api_key": key,
"sort":"pubdate",
"num":10000
}
search = GoogleSearch(params)
results = search.get_dict()
articles = results["articles"]
res = [ sub['title'] for sub in articles ]
print(res)
字符串
控制器
$title = shell_exec("python publicationScripts/title.py $gscID $key");
dd($title);
型
输出
The output shows only 100 articles but there are more than 200 articles
型
1条答案
按热度按时间2izufjch1#
这是意料之中的,因为您还没有应用分页。在您的示例中,您正在迭代文章并提取标题。下面是如何在Python中进行分页。
此外,num每页最多有100个结果。它不能显示更多。这是谷歌的限制
感谢Dmitriy的澄清。使用分页可以得到100多个。