如何修改参数以捕获整个页面
def start_requests(self):
url =#some url
splash_args = {
'html': 1,
'png': 1,
'width': 600,
}
yield SplashRequest(url=url, callback=self.parse,
endpoint="render.json",
args=splash_args)
def parse(self, response):
imgdata = base64.b64decode(response.data['png'])
filename = 'image.png'
with open(filename, 'wb') as f:
f.write(imgdata)
我试着在splash_args中添加"height",图像确实得到了宽度 * 高度,但是额外的高度是空白的,有什么方法可以解决这个问题吗?
2条答案
按热度按时间sqserrrh1#
您可以通过向Lua脚本中添加以下行来捕获整个页面
dced5bon2#
您可以将其添加到主蜘蛛: