curl 在UNIX命令行或shell脚本上创建网页的静态副本

6yjfywim  于 2023-06-06  发布在  Unix
关注(0)|答案(2)|浏览(542)

我需要创建一个网页(所有媒体资源,如CSS,图像和JS包括)在一个shell脚本的静态副本。此副本应可在任何浏览器中脱机打开。
一些浏览器具有类似的功能(保存为... Web Page,complete),它从页面创建一个文件夹,并将外部资源重写为该文件夹中的相对静态资源。
有什么方法可以在Linux命令行上完成并自动化到给定的URL?

8ftvxx2r

8ftvxx2r1#

你可以这样使用wget

wget --recursive --convert-links --domains=example.org http://www.example.org

该命令将递归地下载通过来自www.example.com处的页面的超链接可到达的任何页面www.example.org不跟随example.org域之外的链接。
查看wget手册页以获得更多控制递归的选项。

bkhjykvo

bkhjykvo2#

您希望工具wget镜像站点,请执行以下操作:

$ wget -mk http://www.example.com/

选项:
-m --镜子
启用适用于镜像的选项。此选项打开递归和时间戳,设置无限递归深度并保留FTP目录列表。它目前等同于-r -N -l inf --no-remove-listing。
-k --转换链接
下载完成后,转换文档中的链接,使其适合本地查看。这不仅会影响可见的超链接,还会影响链接到外部内容的文档的任何部分,例如嵌入图像、指向样式表的链接、指向非HTML内容的超链接等。

相关问题