jsoup只处理一小部分html页面

ycggw6v2  于 2021-06-24  发布在  Storm
关注(0)|答案(1)|浏览(273)

我不想垄断这个论坛,但一开始有很多问题。。。
jsoup只正确处理web上找到的html页面的一小部分(肯定少于50%)并在其中发现新的url,这正常吗?这就是我的种子文件所发生的事情,令人沮丧。
或者有更好的解析器在那里我可以使用?
当做

zujrkrfu

zujrkrfu1#

检查http.content.limit的值。可能是因为文档被截断,所以得到了部分结果。
编辑:可以尝试debugparsefilter来查看jsoup生成的dom是什么样子的。正如塞巴斯蒂安所说,这可能与js有关。

相关问题