这里是一些html字符串我从网站通过 AJAX 请求
{
"data":{
label: 'description',
values: ['<p class="description">'
'someting'
'<br>'
'<br>'
'<b>mytitle_1</b>'
'<br>'
'<br>'
'something_1'
'<br>'
'<br>'
'<b>mytitle_2</b>'
'<br>'
'<br>'
'something_2'
'</p>']}
}
values键的值是html片段,我如何获取data[“values”]中的所有文本。我使用的是scrapy,有没有办法通过scrapy的response get方法解析它?
1条答案
按热度按时间zmeyuzjn1#
是的,您只需要提取html内容,将其转换为一个零碎的选择器,并在其上使用
xpath('//text()').getall()
。示例:
输出量: