我需要创建一个网页(所有媒体资源,如CSS,图像和JS包括)在一个shell脚本的静态副本。此副本应可在任何浏览器中脱机打开。一些浏览器具有类似的功能(保存为... Web Page,complete),它从页面创建一个文件夹,并将外部资源重写为该文件夹中的相对静态资源。有什么方法可以在Linux命令行上完成并自动化到给定的URL?
8ftvxx2r1#
你可以这样使用wget:
wget
wget --recursive --convert-links --domains=example.org http://www.example.org
该命令将递归地下载通过来自www.example.com处的页面的超链接可到达的任何页面www.example.org不跟随example.org域之外的链接。查看wget手册页以获得更多控制递归的选项。
bkhjykvo2#
您希望工具wget镜像站点,请执行以下操作:
$ wget -mk http://www.example.com/
选项:-m --镜子启用适用于镜像的选项。此选项打开递归和时间戳,设置无限递归深度并保留FTP目录列表。它目前等同于-r -N -l inf --no-remove-listing。-k --转换链接下载完成后,转换文档中的链接,使其适合本地查看。这不仅会影响可见的超链接,还会影响链接到外部内容的文档的任何部分,例如嵌入图像、指向样式表的链接、指向非HTML内容的超链接等。
2条答案
按热度按时间8ftvxx2r1#
你可以这样使用
wget
:该命令将递归地下载通过来自www.example.com处的页面的超链接可到达的任何页面www.example.org不跟随example.org域之外的链接。
查看
wget
手册页以获得更多控制递归的选项。bkhjykvo2#
您希望工具
wget
镜像站点,请执行以下操作:选项:
-m --镜子
启用适用于镜像的选项。此选项打开递归和时间戳,设置无限递归深度并保留FTP目录列表。它目前等同于-r -N -l inf --no-remove-listing。
-k --转换链接
下载完成后,转换文档中的链接,使其适合本地查看。这不仅会影响可见的超链接,还会影响链接到外部内容的文档的任何部分,例如嵌入图像、指向样式表的链接、指向非HTML内容的超链接等。