selenium 如何从网页的url列表中收集图片和产品信息[已关闭]

myss37ts  于 2022-11-24  发布在  其他
关注(0)|答案(1)|浏览(92)

已关闭。此问题需要更多focused。当前不接受答案。
**想要改进此问题吗?**更新问题,使其仅关注editing this post的一个问题。

6天前关闭。
Improve this question
我想从网址获取产品信息和照片,并将其保存到Excel文件,这样我就可以使用woo commerce将其上传到WordPress电子商务网站。
所以我想把一个网站上的所有产品导出到一个文件中,然后上传到woo commerce,这样可以保存数据输入的时间吗?我对c#和python很熟悉,但对网页报废不熟悉。谢谢!
我已经收集了一个列表的产品网址使用的网站Map的网页。

<url>
        <loc>https://gardeninghaven.com</loc>
        <lastmod>2022-11-16T12:39:50-07:00</lastmod>
        <changefreq>always</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>https://gardeninghaven.com/store/ols/products</loc>
        <lastmod>2022-11-16T14:08:09+00:00</lastmod>
        <changefreq>always</changefreq>
        <priority>0.5</priority>
    </url>
    <url>
        <loc>https://gardeninghaven.com/store/ols/products/hydro-fusion-fill-drain-kit</loc>
        <lastmod>2022-03-30T20:40:51+00:00</lastmod>
        <changefreq>always</changefreq>
        <priority>0.5</priority>
    </url>
    <url>
        <loc>https://gardeninghaven.com/store/ols/products/supermoss-reindeer-moss-preserved-mango-2oz-8075cu-in-bagged</loc>
        <lastmod>2022-05-10T13:53:47+00:00</lastmod>
        <changefreq>always</changefreq>
        <priority>0.5</priority>
    </url>
py49o6xq

py49o6xq1#

有几个选择的网页报废,从我的脑海:BeautifulSoup、Scrapy,甚至使用直接请求访问产品API。

pip install beautifulsoup4
pip install scrapy
pip install requests

相关问题