我想下载的内容,我从“查看页面源代码”,例如在铬或火狐在一些自动化的方式(python或bash..).
wget, curl 或类似的...
如果我使用以下内容,我无法从网站下载正确的数据:
curl 度https://www.google.com/search?foo&baa
铬似乎也有一个问题,在 selenium 的背景下,现在它是默认的快照。(我开始讨厌快照,我知道它越多。)
我想下载的内容,我从“查看页面源代码”,例如在铬或火狐在一些自动化的方式(python或bash..).
wget, curl 或类似的...
如果我使用以下内容,我无法从网站下载正确的数据:
curl 度https://www.google.com/search?foo&baa
铬似乎也有一个问题,在 selenium 的背景下,现在它是默认的快照。(我开始讨厌快照,我知道它越多。)
2条答案
按热度按时间bwntbbo31#
例如,您可以创建文件:
curl https://www.gnu.org/ >> gnu_source
然后 curl 链接并将其附加到gnu_souce:
curl https://www.gnu.org/ >> gnu_source
个rbpvctlc2#
解决方法非常简单...使用引号!
而不是
例如,许多网站使用
&
来分隔变量,但是bash会将其解释为命令终止符,从而误解为多个命令。将整个url放在引号中可以使bash正确地将其解释为一个url并传递给curl。