How to use WGET to separate the marked links from this side?
这可以用CURL完成吗?
我想从此页下载URL并将其保存在文件中。
我试过了。wget -r -p -k https://polsatboxgo.pl/wideo/seriale/pierwsza-milosc/5027238/sezon-44/5027472/pierwsza-milosc-odcinek-2984/585ddf5a3dde69cb58c7f42ba52790a4
linq ·戈弗把地址分开了。
版本
如何从终端下载地址到文件?
可以在WGET的帮助下完成吗?
它可以在CURL的帮助下完成吗?
I want to download addresses from this page and save them to the file.
我想保存这些链接。
` https://polsatboxgo.pl/wideo/seriale/pierwsza-milosc/5027238/sezon-44/5027472/pierwsza-milosc-odcinek-2984/585ddf5a3dde69cb58c7f42ba52790a4
https://polsatboxgo.pl/wideo/seriale/pierwsza-milosc/5027238/sezon-44/5027472/pierwsza-milosc-odcinek-2985/e15e664718ef6c0dba471d59c4a1928a
https://polsatboxgo.pl/wideo/seriale/pierwsza-milosc/5027238/sezon-44/5027472/pierwsza-milosc-odcinek-2986/58edb8e0f06dc3da40c255e50b3839cf
'第1版
2条答案
按热度按时间ffx8fchx1#
您将需要使用类似于
Download Serialized DOM
我把它添加到我的Firefox浏览器,它的工作,虽然它是有点慢,唯一的时间,你知道它是完成时,.html.part文件消失,为相应的**.html文件,您将使用Add-on按钮保存。
基本上,这会将整个网页**(不包括二进制文件,即图像、视频等)保存为单个文本文件。
此外,只有在保存这些文件时,开发人员才指出存在一个bug,您必须允许“在私有模式下使用”来绕过bug。
下面是显示的全季44索引页的一个片段(注意地址栏中的地址):
因为我没有你的权限我不能复制,但是服务器对我隐藏了个人视频的页面(当你点击图片时会看到什么),因为我没有登录权限。他们给予我的是索引,而不是地址栏中的地址(他们的安全进程在工作)。不过,索引页可能应该在“.../sezon-44/5027472/”之后显示一些不同的内容。
使用保存的DOM文件作为输入,以下内容将提取必要的引用:
这将为您提供**${TMP}.5**的报告,如下所示:
注意:在下图中,“文件夹”和“星星”之间的图标,* 在该图像的地址栏中 *,是下载序列化DOM扩展的按钮,用于将当前显示的页面捕获为完全示例化的DOM文件。
dvtswwa32#
要保存上面提供的wget命令的输出,请在命令行末尾添加以下内容:
在这个wget之前,你需要定义如下内容:
您只需要从该列表中选择一个后缀类型,并删除其他后缀类型。