如何获取标签中的所有文本,即:"Digital Business Designer (m/w/d)"
从这样的标签
<a class="title">Digital Business Designer (m/<wbr>w/<wbr>d)</a>
我试过下面的代码,但它只返回"Digital Business Designer (m/"
。
async def parse(self, response):
programs = response.css('#programslist')
for program in programs.css('.title'):
title = program.css('::text').get()
title = re.sub(r'<wbr>', '', title)
yield {'title': title}
1条答案
按热度按时间pjngdqdw1#
当与
getall()
组合时,可以使用xpath//text()
指令获取列表中元素及其所有子元素的内部文本。然后可以使用''.join()
将文本组合回单个字符串。例如:
输出