linux 通过命令行“查看页面源”

jvidinwx  于 2022-11-02  发布在  Linux
关注(0)|答案(2)|浏览(159)

我想下载的内容,我从“查看页面源代码”,例如在铬或火狐在一些自动化的方式(python或bash..).
wget, curl 或类似的...
如果我使用以下内容,我无法从网站下载正确的数据:
curl 度https://www.google.com/search?foo&baa
铬似乎也有一个问题,在 selenium 的背景下,现在它是默认的快照。(我开始讨厌快照,我知道它越多。)

bwntbbo3

bwntbbo31#

例如,您可以创建文件:
curl https://www.gnu.org/ >> gnu_source
然后 curl 链接并将其附加到gnu_souce:
curl https://www.gnu.org/ >> gnu_source

rbpvctlc

rbpvctlc2#

解决方法非常简单...使用引号!

curl "https://www.google.com/search?foo&baa"

而不是

curl https://www.google.com/search?foo&baa

例如,许多网站使用&来分隔变量,但是bash会将其解释为命令终止符,从而误解为多个命令。将整个url放在引号中可以使bash正确地将其解释为一个url并传递给curl。

相关问题