Scrapy -从getall()结果中删除逗号和空格

fslejnso  于 2022-11-23  发布在  其他
关注(0)|答案(1)|浏览(106)

有没有一种有效的方法可以通过getall()直接从生成的结果中删除逗号呢?例如,我尝试检索的数据是这样的格式:

<div>
Text 1
<br>
Text 2
<br>
Text 3
</div>

我目前的选择器是:

response.xpath("//div//text()").getall()

这确实得到了正确的数据,但它们显示为:

Text 1,
Text 2,
Text 3

代替

Text 1
Text 2
Text 3

我知道它们被识别为一个列表,这就是逗号的原因,但是否有一个直接的功能来删除它们,而不影响文本本身的逗号?

swvgeqrz

swvgeqrz1#

我只想留下我使用的解决方案,以备不时之需:

tc = response.xpath("//div//text()").getall() #xpath selector
tcl = "".join(tc) #used to convert the list into a string

相关问题