javajsoup从一个网站抓取imgsrc返回一个奇怪的url

zengzsys  于 2021-06-30  发布在  Java
关注(0)|答案(1)|浏览(435)

当我试着刮的时候:https://www.game.co.uk/webapp/wcs/stores/servlet/ajaxcatalogsearchview?searchtermscope=&searchtype=&filterterm=&catgroupid=&maxprice=&contentonly=&filtertermoperator=&raschematype=&attributename1=genre&stype=simplesearch&filtertype=&resultcatentrytype=2&catalogid=10201&pageview=image&sortby=most_popular_desc&minprice=&categorytype=&attributevalue1=4294952868&storeid=10151&langid=44&catgrpschematype=&storeonly=&searchterm=rpg&searchtermcoperator=&pagenumber=1&instockonly=true&pagesize=96
对于img,我得到的回报是:
/wcsstore/safestorefrontassetstore/locale/en\u gb/style1/img/email/spacer.gif
我尝试使用.attr(“abs:src)以及.attr(“src”),但都返回错误的URL。

Elements prods = doc.select(".product");
Elements img = prods.get(i).select(".productHeader a img");
String imageUrl = img.attr("src");
z3yyvxxp

z3yyvxxp1#

我认为你的问题在于你的选择:
elements img=prods.get(i).select(“.productheader>a>img”);
那应该能解决你的问题!
新条目:您需要检查“data src”,它在前面的字符串imageurl=img.attr(“data src”)中包含没有协议的图像的url;
=>例如“//img.game.co.uk/ml2/7/3/1/5/731542\u ps4\u b.png”

相关问题