已关闭。此问题需要更多focused。当前不接受答案。
**想要改进此问题吗?**更新问题,使其仅关注editing this post的一个问题。
6天前关闭。
Improve this question
我想从网址获取产品信息和照片,并将其保存到Excel文件,这样我就可以使用woo commerce将其上传到WordPress电子商务网站。
所以我想把一个网站上的所有产品导出到一个文件中,然后上传到woo commerce,这样可以保存数据输入的时间吗?我对c#和python很熟悉,但对网页报废不熟悉。谢谢!
我已经收集了一个列表的产品网址使用的网站Map的网页。
<url>
<loc>https://gardeninghaven.com</loc>
<lastmod>2022-11-16T12:39:50-07:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://gardeninghaven.com/store/ols/products</loc>
<lastmod>2022-11-16T14:08:09+00:00</lastmod>
<changefreq>always</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>https://gardeninghaven.com/store/ols/products/hydro-fusion-fill-drain-kit</loc>
<lastmod>2022-03-30T20:40:51+00:00</lastmod>
<changefreq>always</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>https://gardeninghaven.com/store/ols/products/supermoss-reindeer-moss-preserved-mango-2oz-8075cu-in-bagged</loc>
<lastmod>2022-05-10T13:53:47+00:00</lastmod>
<changefreq>always</changefreq>
<priority>0.5</priority>
</url>
1条答案
按热度按时间py49o6xq1#
有几个选择的网页报废,从我的脑海:BeautifulSoup、Scrapy,甚至使用直接请求访问产品API。