我试图刮下面的网站,我已经成功地达到了,直到生成的机构。我想知道如何访问其他细节,如名称,评级,标题,说明。下面是代码。我想弄清楚如何访问的关键字,如名称,评级,审查的响应
密码:
import scrapy
import json
from pprint import pprint
class nykacr(scrapy.Spider):
name = 'nykaa'
allowed_domains=['nykaa.com']
start_urls = ["https://www.nykaa.com/gateway-api/products/683166/reviews?pageNo=1&filters=DEFAULT&domain=nykaa"]
def parse(self,response):
datas = json.loads(response.body)
1条答案
按热度按时间z9smfwbn1#
您只需要获取
reviewData
字段并像列表一样迭代它:例如: