scrapy 如何提取全价与零头？

kmpatx3s 于 2022-11-09 发布在其他

关注(0)|答案(3)|浏览(164)

你好，我试图废弃电子商务页面，但无法获得价格。
我有一页有这样几行字：

<span class="price">255,<sup>99</sup>€</span>
<span class="price">255 €</span>

中的每一个
但我不能把所有的价格都提取到一行。
我试探着：
如果您有任何问题，请联系我们。
但是它忽略了 <sup> 标签中的文本 ... 我做错了什么？请帮助。

scrapy

来源：https://stackoverflow.com/questions/42466553/how-to-extract-full-prices-with-scrapy

3条答案

按热度按时间

huus2vyu1#

你需要在文本前再加一个斜杠，这样它就可以处理所有节点。

response.xpath('//span[@class="price"]//text()').extract()

Text='255,'
Text='99'
Text='€'

赞(0）回复(0）举报 2022-11-09

xuo3flqw2#

你应该放两个水花而不是一个。

response.xpath('//span[@class="price"]//text()').extract()

此语句返回指定标签下的所有文本作为列表对象。注意，返回的列表可能包含一些无用的元素，如空或回车符。因此，如果您只想提取价格信息，可以使用regex。

response.xpath('//span[@class="price"]//text()').re(r'[\d.,]+')

货币符号被忽略。

['255,','99','255']

最后，如果你想得到255. 99从网页

''.join(response.xpath('//span[@class="price"][1]//text()').re(r'[\d.,]+')).replace(",",".")

您首先获得所有产品。
最终代码：

products = response.xpath('//*[@class="catalog-table"]//td')
for prod in products:
    price = ''.join(prod.xpath('//span[@class="price"][1]//text()').re(r'[\d.,]+')).replace(",",".")
    print price

赞(0）回复(0）举报 2022-11-09

whlutmcx3#

检查源代码HTML。源代码中包含：
我一整天都在寻找同一个问题，发现这个答案非常适合这个问题

response.xpath('//meta[@itemprop="price"]/@content').get()

赞(0）回复(0）举报 2022-11-09

我来回答

scrapy 如何提取全价与零头？

3条答案

相关问题

热门标签

最新问答